こんにちは。YJICAスタッフです。
(YJICA = Yahoo! JAPAN インターネット クリエイティブアワードの略です。)
本日は7月10日に開催されましたロクナナワークショップさんとの
クリエイティブカレッジのレポートをお届けいたします。
特にTech Blogをご覧のみなさまにはマッシュアップセッションの様子をお伝えできればと思います。
▼マッシュアップセッション Web APIを使ってテキストデータを魅せる!▼
Tech Blogでも内容の説明があったマッシュアップセッションですが、
イベント当日は金曜平日の14時開催で空模様も怪しまれていたにもかかわらず、
たくさんのデベロッパーの方にご来場いただけました。
また、テキストを取り扱うクリエイティブに興味のあるクリエイターさんも
たくさん、ご参加いただけましたよ。
さて、本題のマッシュアップセッションですが、
テキスト解析APIとAPIを絡めたテキストマイニングのお話の
二部構成でお送りいたしましたので、各々ご紹介いたします。
●第一部:テキスト解析APIの活用方法●
まず、日本語の機械処理で必須となる「形態素解析」って何? という説明を
弊社の山下より、ご説明させていただきました。
詳しくはTech Blogの以前のエントリーをご覧になっていただくか、
山下が公開している「日本語形態素解析入門」を参照していただくとして、
基礎となる仕組みをご来場の方にご理解いただきながら、その知識をもとにYahoo!デベロッパーネットワークで公開しているテキスト解析APIを使ったデモを例に、使いどころなどをお伝えしていす。
【形態素解析でご紹介したデモ集】
・文で検索
文章から簡易的に検索を行うデモ
・テキスト変換 (笑)
入力された文章の名詞連続の最後に「(笑)」を差し込むデモ
・Web関連語抽出
Web上のドキュメントから関連すると類推される語を抽出するデモ
その後に形態素解析から発展して、「キーフレーズ抽出API」の説明に移ります。
キーフレーズ抽出APIでは、文章から特徴となるキーフレーズを返すAPIであることから
簡単にタグクラウドが生成できるため、それを用いたデモも紹介しています。
【キーフレーズ抽出でご紹介したデモ集】
・YeNikki - Yahoo! JAPAN API を利用した自動絵日記システム
解説はこちら
非常にお手軽に日本語の文章を取り扱えることを
ご来場いただけた方にお伝えできたかと思います。
このセッションで日本語を簡単に取り扱う勘所が分かってしまえば、
マッシュアップを作るデベロッパーさんにも、
日本語をフォントで取り扱うクリエイターさんにも、お役に立てた内容だったと思います。
●第二部:ウェブ検索APIを用いたテキストマイニング●
さて、第一部と変わって第二部では、テキスト解析と同じく
Yahoo!デベロッパーネットワークで公開されているウェブ検索APIを用いて
少しアカデミックなテキストマイニングのお話になりました。
第一部と比較すると、Web上にあるあまたのテキスト情報を取り扱うと
どういったことが実現できるのかを、分かりやすい例を交えながら、
テキストマイニングという視点でお伝えしています。
テキストマイニングのアイデアを当日にご紹介したサイトでご説明しますと
【当日にご紹介したサイト】
・英文校正サイト 「NativeChecker 」
・英語例文検索 EReK
・日本語例文検索 JReK
・有名人身長推定サイト SETAKE
・uroboe うろぼえ(例:アンブレラ)
解説はこちら
これらのサイトに共通している点は、ウェブ検索APIを利用している点です。
どこを使っているかというと……
皆さんもYahoo!を始め、検索エンジンをご利用いただいているかと思いますが、
その検索結果の中に検索キーワードを含む、短い文章が表示されますよね?
ちょっと、Web業界っぽく言うと「スニペット(snippet)」って言います。
ウェブ検索APIを使って返されるスニペットを使って上述のサイトなどでは、
英語の文章の中でよく使われるフレーズなどを比較して見せて、
様々な言い回しなどをサイト利用者に提供したり、
また、文章中に表記されている情報を集約して推定される内容を提供しているのですね。
こういった大量にあるWeb上のテキストデータをウェブ検索APIを使って、
どういったマッシュアップに昇華するのか、
その勘所をこのセッションではお伝えしていました。
難しいお話も一部ありましたが、テキストという視点で行われたこのセッション
おかげ様でご参加いただけた皆さまには大好評でした!
当日にご参加いただけなかった皆さまに少しでも
当日の雰囲気とその勘所がお伝えできればと思いレポートいたしました。
もう少し、ここが知りたいなどありましたら、コメント欄からご遠慮なく!







