2010年3月23日

Yahoo! JAPAN研究所

Yahoo! JAPAN研究所:Yahoo! JAPAN ならではの先端技術研究を(2)

  • このエントリーをはてなブックマークに追加

こんにちは。Yahoo! JAPAN研究所で研究員をしております柿原です。

前回に引き続き、「japan.internet.com」にて連載中の"進化する「LIFE ENGINE」 - Yahoo! JAPAN 2010年の新技術"の第5回に掲載されたYahoo! JAPAN研究所の紹介をし たいと思います。今回は、いま研究所で取り組んでいる自然言語処理と画像処理の研究について少し詳しく紹介させていただきました。ぜひご覧ください。

※「japan.internet.com」のご厚意により、3月10日に掲載された第5回目の記事を以下に転載します。
------下記転載------

前回は、Yahoo! JAPAN 研究所の概要についてご紹介しました。今回、そして次回は、2回続けて Yahoo! JAPAN 研究所での活動をより具体的にご紹介します。

近年の急速な Web マルチメディア化を背景に、メディア処理技術と呼ばれる自然言語処理、画像・映像処理、音声処理は重点領域となっています。今回は Yahoo! JAPAN 研究所が取り組む自然言語処理と画像処理の研究についてご紹介したいと思います。

Yahoo! JAPAN 研究所における自然言語処理領域の研究は、形態素解析、構文解析、係り受け解析などの基礎技術研究から、大規模データを使った機械学習手法や情報探索手法の研究や知識構造の解析まで多岐に渡り、その研究成果は Yahoo! JAPAN のさまざまなサービスに利用されています。

たとえば、「Yahoo! BEAUTY」のコスメ検索には、研究所で開発された「LUIGI(ルイージ)」という技術が使われています。「LUIGI」は類似文字列検索のために研究開発したライブラリで、「ダイヤリー」と「ダイアリー」のような少しだけ表記の異なる単語や、「クラブ」と「倶楽部」のような読みは同じでも字面が異なる単語などを高速で探し出します。

「Yahoo! BEAUTY」のコスメ検索のほか、「Yahoo!テレビ.Gガイド」のテレビ番組検索などでも利用されており、お客さまが入力したキーワードでの検索結果がゼロ件だった場合、この「LUIGI」の機能が入力キーワードと近い単語を瞬時に検索結果として提示します。


「Yahoo! BEAUTY」のコスメ検索

研究成果は Yahoo! JAPAN 各サービスへの技術貢献以外にも、「Yahoo!デベロッパーネットワーク」で Web API として公開しています。現在は、形態素解析、かな漢字変換、ルビ振り、校正支援、係り受け解析、キーフレーズ抽出などの API がご利用いただけます。

また、画像処理領域の研究成果は、「Yahoo!ラボ」で「VisualSeeker」(類似画像検索・スケッチ検索)として公開しています。

この「VisualSeeker」は、Yahoo! JAPAN 研究所で独自開発されたさまざまな技術を使い、画像を解析して抽出した画像特徴によって、大量の画像を「高速」に検索します。また、画像に付随したテキストを利用する一般的な画像検索とは異なり、文字入力をしなくても画像検索が可能です。こうした基礎技術を使い、現在公開されている「VisualSeeker」では、類似画像検索とスケッチ画像をグラフィカルなインターフェイスでご利用いただけます。


VisualSeeker 類似画像検索


VisualSeeker スケッチ検索

今回は、自然言語処理領域、そして画像処理領域の研究活動についてご紹介しました。次回は、社会科学領域の研究活動についてご紹介する予定です。引き続きご期待ください。

Yahoo! JAPANでは情報技術を駆使して人々や社会の課題を一緒に解決していける方を募集しています。詳しくは採用情報をご覧ください。

  • このエントリーをはてなブックマークに追加