こんにちは。Yahoo! JAPANの会話型ボイスエージェントアプリ「Yahoo!音声アシスト」(Androidアプリ)のシナリオライター・マスダです。
今年の3月中旬、「言語処理学会第25回年次大会(NLP2019)」が開催されました。この記事では、Yahoo!音声アシストチームが、技術発表をしてきた様子をレポートします。
「言語処理学会」とは、どんな目的を持った組織?
「Yahoo!音声アシスト」では、音声認識アプリを開発、展開するサービスの特性から、大学や大学院まで、「言語処理」や「機械学習」などの分野を専攻したメンバーが中心になっています。
そのため、「言語処理学会(The Association for Natural Language Processing)」に関わり続けているメンバーが数多くいます。
「言語処理学会」は、「我が国の研究成果処理の発表の場として、また国際的な研究交流の場」として、1994年4月1日に設立されたそうです。
その「言語処理学会」が運営している「言語処理学会第25回年次大会(NLP2019)」が、今年の3月12日から15日までの日程で、名古屋大学にて開催されました。
今回のNLP2019では、全体の参加者が1,250人と、初めて千人の大台を突破したそうです。
岡山コンベンションセンターで開催された昨年は、全体の参加者が983人でした。前々年、筑波大学での開催時は、全体の参加者が約920人と、年々、右肩上がりに参加者が増え続けています。
発表件数については、昨年の332件から、今年は、398件に増えました。
また、今回、プラチナスポンサーが26社・団体、ゴールドスポンサーが21社・団体、シルバースポンサーが17社・団体と、65社・団体のスポンサードがあったそうです。昨年から全体で8社・団体増えています。
Yahoo! JAPANはスポンサーが一桁代だった頃から長年、協賛を続けていて、2015年からは、大会のプラチナスポンサーとして協賛しております。
そこで、私も言語処理に関わるシナリオライターとして最新の研究やトレンドなどを探るべく、初めて参加してきました。
今回、プラチナスポンサーには、Google、Baiduなどの外資から、楽天技術研究所、リクルートテクノロジーズなどの大手企業の研究部門、LINE、メルカリなどのIT企業、国立研究開発法人情報通信研究機構や理化学研究所革新知能統合センター、さらには、大手広告代理店の電通まで、言語処理研究に関わりのある企業・団体が名を連ねていました。
技術力が高く、テクノロジー分野を引っ張っている多くの企業・団体が注力している研究分野であることがわかります。
参加者に配布された大会冊子の後半には、プラチナスポンサーとして参加している企業の広告ページが入っていましたが、どちらも、優秀な学生さん、研究者への求人文言であふれていました。この領域における人財の争奪戦が起きていることは言うまでもありません。
Yahoo! JAPANのブースにも、ありがたいことに、熱心に話を聞きにきてくれる学生さんの姿が多数ありました。
とりわけ、研究者の方にとって、職場としてのYahoo! JAPANの強みは、ニュースから天気、路線案内、さらには、Eコマース、電子決済などなど、多岐にわたるサービスを展開していること。そして、膨大なユーザーのデータを利活用しながら研究・開発を行えるところではないでしょうか。
(Yahoo! JAPANでは、毎年、インターンを募集しています。ご興味のある方は、ホームページをぜひ、チェックしてくださいませ)
さて、今回、Yahoo! JAPANでは、2チームがポスター発表へと参加。Yahoo!音声アシストチームでは、「対話アシスタントにおけるローカル検索意図発話の分析」という発表を行いました。
(論文はこちらをご参照ください)
大学時代から、「言語処理学会年次大会」に参加してきて、今回、初めて主担当としてポスター発表を行ったエンジニアのマツナギに話を聞きました。
「Yahoo!音声アシスト」チームの技術発表を通して
Q. 今回、参加してみて感じた大会全体の変化、傾向はあるか?
年々日程と会場の確保をするのが難しくなっているという話からも、参加者の増加傾向を強く感じています。元々は言語処理の研究室にいる学生さんとして出会った方が、卒業後も言語処理を続けているケースがよく見られるため、肩書が別の大学や企業に変わりつつも年次大会で再会できることはうれしい驚きでした。
また、昨今のニューラルネットワークに関わる技術の発展など、日々かなりのスピードで新しい技術・研究が生み出されているのにもかかわらず、学生の方でもきちんとキャッチアップして自身の研究に積極的に取り入れられていることに感銘を受けました。
Q. 他の研究者との交流で印象深かった話題などは?
大学院時代、日本の各地にある研究室で同学年として交流していた同期たちと再会しました。今はアカデミックな場や企業などさまざまな場所で活躍しており、それぞれがいる場所ごとの面白い話や苦労話を聞くことができました。
また、Yahoo! JAPANで2018年度に発表した研究を一冊にまとめた論文集「Yahoo! JAPAN Selected Papers in 2018」は好評をいただいており、「一冊頂きたいです」「まだ残っていますか?」など声も掛けていただいたのは非常にうれしかったです。
Q. 今回、Yahoo!音声アシストチームとして、発表した内容とは?
Yahoo!音声アシストの意図理解部分、その中でも特に「ローカル検索かどうか判定する部分(ローカル検索意図)」を題材として、実際にユーザーが使うサービスならではの難しさや取り組みについてお話させていただきました。
ローカル検索は「近くのカフェ」などユーザーが指定した地域に存在する施設を検索して提示する機能です。
音声アシストに限らず、話し言葉を解析してウェブ検索する際によく使用される機能であるため、幅広い発話に対応できるよう改善に取り組んでいました。
ただ、音声アシストに入力されるユーザーの用件はローカル検索だけではなく雑談からタスクまで幅広い話題が考えられます。また、ユーザーは施設の名前を指定する時に必ずしも辞書に入っている正規の表現を使うとは限りません。
今回の発表ではいくつかの例を挙げることで、音声アシストやその中で扱う問題の認知度を少しでも高め、興味を持っていただくことを目的としていました。
Q. 発表時、参加者からはどんな質問、反応があったのか?
音声アシストがどの程度今の問題を解けているか、という実際のシステムとしての実用性に関する質問はよくいただきました。また、「ユーザーが対話システムに慣れるにつれてどのように発話が変化するか見てみたら?」「ユーザーの発話傾向や属性に応じて応答の内容を変えられるともっとよくなりそう」などの興味深いアイデアをご提案いただけて、非常に参考になりました。
今回は、実際に音声アシストを使ってもらうために共著者と協力してデモも用意していました。発表会場は多くの人が活発に議論を行っていたため雑音が少し心配だったのですが、無事に発話を聞き取ることができたため、実用性はアピールできたのではないかと思います。また、音声アシストは一定状況下では文脈も考慮できるので、その点は評価していただきました。ただし、まだまだ対応できない発話もあったため、そこは今後も改善に取り組んでいこうと思いました。
Q. 大会全体でさまざまな発表があったが、どの発表が印象深かったか?
特に身近に感じられたのは、「機械読解」に関する概要や今後の展望が説明されたチュートリアルでした(NTTメディアインテリジェンス研究所の西田氏)。
「機械読解」とは、ユーザーからの質問に対する適切な応答をテキストから特定するタスクで、コールセンターやWikipediaからのテキストが主に題材とされていました。音声アシストも性質こそ異なるもののユーザーの質問に答える必要があるため、「音声アシストのログデータだったらどんな似た現象が見つかるだろうか?」と考えながら楽しくお話を伺うことができました。
また、言語処理の要素技術にしっかり取り組んでいる研究には、もともと個人的な興味があったのでいくつか拝見していました。
最近は「Universal Dependencies」のように、あらゆる言語間で統一された形式を扱っていく方向性もありますが、言語ごとの特色や難しさに着目している研究は自然言語の奥深さについて思いをはせられるので聞いていて個人的に楽しいなと思います。
今回、Yahoo!音声アシストチームでは、話を聞いたマツナギ、シナリオライターのマスダに加え、開発エンジニア、サービスマネージャーなども参加して、われわれのサービスに紐付けながら、言語処理領域に関わる知見を深めました。
引き続き、Yahoo!音声アシストでは、国内外の最先端の研究事例をキャッチアップしながら、あるいは、研究と論文発表などでもリードしながら、サービスのさらなるアップデートを続けていきたいと思っています。
Yahoo!音声アシスト(Androidアプリ)を引き続き、よろしくお願いします。
文・撮影:Yahoo!音声アシスト向けシナリオライター・マスダ
こちらの記事のご感想を聞かせください。
- 学びがある
- わかりやすい
- 新しい視点
ご感想ありがとうございました