こんにちは。YJICAスタッフです。(YJICA = Yahoo! JAPAN インターネット クリエイティブアワードの略です。)
本日は7月10日に開催されましたロクナナワークショップさんとのクリエイティブカレッジのレポートをお届けいたします。
特にTech Blogをご覧のみなさまにはマッシュアップセッションの様子をお伝えできればと思います。
▼マッシュアップセッション Web APIを使ってテキストデータを魅せる!▼Tech Blogでも内容の説明があったマッシュアップセッションですが、イベント当日は金曜平日の14時開催で空模様も怪しまれていたにもかかわらず、たくさんのデベロッパーの方にご来場いただけました。
また、テキストを取り扱うクリエイティブに興味のあるクリエイターさんもたくさん、ご参加いただけましたよ。
さて、本題のマッシュアップセッションですが、テキスト解析APIとAPIを絡めたテキストマイニングのお話の二部構成でお送りいたしましたので、各々ご紹介いたします。
●第一部:テキスト解析APIの活用方法●
まず、日本語の機械処理で必須となる「形態素解析」って何? という説明を弊社の山下より、ご説明させていただきました。
詳しくはTech Blogの以前のエントリーをご覧になっていただくか、山下が公開している「日本語形態素解析入門」を参照ください
このセッションで日本語を簡単に取り扱う勘所が分かってしまえば、マッシュアップを作るデベロッパーさんにも、日本語をフォントで取り扱うクリエイターさんにも、お役に立てた内容だったと思います。
●第二部:ウェブ検索APIを用いたテキストマイニング●
さて、第一部と変わって第二部では、テキスト解析と同じくYahoo!デベロッパーネットワークで公開されているウェブ検索APIを用いて少しアカデミックなテキストマイニングのお話になりました。
第一部と比較すると、Web上にあるあまたのテキスト情報を取り扱うとどういったことが実現できるのかを、分かりやすい例を交えながら、テキストマイニングという視点でお伝えしています。
テキストマイニングのアイデアを当日にご紹介したサイトでご説明しますと
【当日にご紹介したサイト】
- 英文校正サイト NativeChecker
- 英語例文検索 EReK
- 日本語例文検索 JReK
- なんでも比較
- 有名人身長推定サイト SETAKE
- uroboe うろぼえ
これらのサイトに共通している点は、ウェブ検索APIを利用している点です。
どこを使っているかというと……皆さんもヤフーを始め、検索エンジンをご利用いただいているかと思いますが、その検索結果の中に検索キーワードを含む、短い文章が表示されますよね?ちょっと、Web業界っぽく言うと「スニペット(snippet)」って言います。
ウェブ検索APIを使って返されるスニペットを使って上述のサイトなどでは、英語の文章の中でよく使われるフレーズなどを比較して見せて、様々な言い回しなどをサイト利用者に提供したり、また、文章中に表記されている情報を集約して推定される内容を提供しているのですね。
こういった大量にあるWeb上のテキストデータをウェブ検索APIを使って、どういったマッシュアップに昇華するのか、その勘所をこのセッションではお伝えしていました。
難しいお話も一部ありましたが、テキストという視点で行われたこのセッションおかげ様でご参加いただけた皆さまには大好評でした!
当日にご参加いただけなかった皆さまに少しでも当日の雰囲気とその勘所がお伝えできればと思いレポートいたしました。
こちらの記事のご感想を聞かせください。
- 学びがある
- わかりやすい
- 新しい視点
ご感想ありがとうございました