ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog

テクノロジー

言語処理学会第17回年次大会で発表しました #nlp2011

地震の余波が収まらぬところ失礼します。要素技術開発部の奥野と申します。

2011年3月7日(月)~3月11日(金)に愛知県の豊橋技科大で行われた言語処理学会で、ヤフーから3件の発表を行いました。

言語処理学会第17回年次大会(NLP2011)

この記事では、その際の発表スライドと論文について紹介します。

言語処理学会とは?

言語処理学会とは自然言語処理に関する国内最大の学会で、年4回の学会誌の発行と年1回の年次大会の開催を主な活動としています。毎年3月に行われている年次大会では、この分野の研究者・技術者が一同に会し、活発な議論が行われています。事前登録の情報によると、本会議には約500名の方が参加されたそうです。年次大会は毎年関東圏と地方で交互に開催されているのですが、今年は愛知県の豊橋技科大で行われました。実際の学会は以下のようなスケジュールで行われ、11日まで豊橋に滞在された方は地震の揺れはほとんど感じなかったものの、新幹線の運航停止により翌日まで足止めされた方も多くいたようです。

  • 3月7日(月) チュートリアル
  • 3月8日(火) 本会議 第1日、招待講演
  • 3月9日(水) 本会議 第2日、総会、招待講演、特別講演、懇親会
  • 3月10日(木) 本会議 第3日
  • 3月11日(金) 併設ワークショップ

自然言語処理とは、人間が使用する言葉を対象としてコンピュータによって処理を行う技術です。情報科学の分野では言語というとプログラミング言語などの人工言語を指すことがあるため、それらと区別する意味で人間の言葉を「自然言語」と呼んでいます。英名はNatural Language Processingで略すとNLPとなりますが、同じくNLPと略される神経言語プログラミング(Neural Language Programming)とは異なります。今回の学会でもヤフーを含むウェブ企業が協賛(スポンサー)に名を連ねているように、自然言語処理はテキストデータを多く扱うウェブアプリケーションとは関係が深く、検索エンジンなどの技術に応用されています。

大規模日本語ブログコーパスにおける言語モデルの構築と評価

上記に加え発表させていただいた論文はこちら:
「大規模日本語ブログコーパスにおける言語モデルの構築と評価」. 奥野陽, 颯々野学. 言語処理学会第17回年次大会(NLP2011), C4-5, 2011..

「確率的言語モデル」と呼ばれる基礎的な技術を、Hadoopを使って大規模な日本語ブログコーパスに適用した場合の性能について評価を行いました。日本語入力のテーマセッションで発表を行ったのですが、異色の発表にも関わらず様々な方に興味を示していただき、質疑応答を行いました。

クエリログとスニペットの単語連接頻度に基づくWeb検索クエリのセグメンテーション

上記に加え発表させていただいた論文はこちら:
「クエリログとスニペットの単語連接頻度に基づくWeb検索クエリのセグメンテーション」.
三宅純平, 塚本浩司, 颯々野学. 言語処理学会第17回年次大会(NLP2011), B5-3, 2011.

検索キーワード(クエリ)を分割しなおすことで、検索精度を向上させようという試みです。クエリログを用いることができるというのは、ヤフーにおける自然言語処理研究の強みの1つとなっていると思います。

スニペットとウェブカウントを用いたウェブ検索クエリの分類

上記に加え発表させていただいた論文はこちら:「スニペットとウェブカウントを用いたウェブ検索クエリの分類」.大久保拓也, 颯々野学. 言語処理学会第17回年次大会(NLP2011), F3-1, 2011.

クエリのカテゴリを分類するために、検索結果の概要(スニペット)に固有表現抽出を適用した結果と、検索パターンのヒット数を用いた結果を統合するという研究です。

おわりに

要素技術開発部では、Yahoo! JAPAN研究所と連携して言語・音声・画像などの解析を行う研究開発を行っています。先日公開された音声検索アプリにも関係していますし、検索やレコメンドなどのサービスのコンポーネントに関係していることもあります。ヤフーの組織の中ではR&D統括本部プラットフォーム開発本部の中に位置しています。Yahoo! JAPANならではの大規模なデータやユーザに関するデータを扱うことで、これらの分野やサービスに貢献できることは大きいと感じています。今後も機会があれば学会への参加や本ブログでの報告を行っていきたいと思いますので、どこかで見かけたらよろしくお願いします。

こちらの記事のご感想を聞かせください。

  • 学びがある
  • わかりやすい
  • 新しい視点

ご感想ありがとうございました

このページの先頭へ