レコメンデーション技術の村尾です。
先日(6月6日)、クックパッドで開催された Machine Learning Casual Talks(#MLCT) において、Yahoo! JAPANの提供しているパーソナライズ・ニュース(あなたにおすすめの記事)での、機械学習(Machine Learning)の活用事例について講演を行いました。
MLCTという機械学習についてのかなりニッチなイベントであったにも関わらず、聴講者募集から枠が埋まるまでに30分程度しかかからなかったと聞き、この分野で普段業務を行われている、または関心のあるエンジニアの多さと、熱量の大きさに驚かされました。
ちなみに"Casual"について事前の認識合わせを全く行っていなかったのですが(汗)、実務レベルでの事前知識がシェアできていて、好きなことばかり話すことができる、という定義だそうです(狭義)。カジュアルって怖い
AWS Casual Talks#1 で説明したカジュアルとはを再掲 http://t.co/CdlqWIlDES #awscasual
— con_mame (@con_mame) 2014, 4月 18
発表者は、ALBERTの @komiya_atsushi 氏、PFIの @unnonouno 氏、ヤフーから深澤 良介、村尾 一真です。
パーソナライズニュースを支えるML業務のまわしかた@Yahoo! JAPAN
講演内容の詳細についてはスライドを参照いただければと思いますが、日次で数百万のユーザーにパーソナライズされたニュースを提供している「あなたにおすすめの記事」サービスにおいて、機械学習をどのように工夫しているかという点と、精度向上のための施策をどのように実施しているかについてまとめました。
Twitter上で特に反響のあった点は
- 15秒に1本新コンテンツ
- 同一日のデータで交差検定するより、日付など変えてテストしたほうがいい
(日ごとに変化していくデータに対して、その日のうちのデータで交差検定は確かにあまり意味がない) - 裏付けとしての精度評価
など。やはり実務に基づいた経験談というのが人気でした。
また、講演後にはパネルディスカッション形式で質問をいただきましたが、A/Bテストの施策アイデアについて具体的な実施方法の提案をいただいたり、機械学習の適用についての「データ・特徴量・アルゴリズム」の重要性についての議論を行ったりと、こちらもかなり充実した内容となりました。
終わりに
MLCT当日はかなりの大雨であったにも関わらず、非常に多くの技術者の方にご参加いただきました。オープニングでの主催 @chezou 氏のアナウンスのとおり、この分野では論文ベースでの知見共有がほとんどであるものの、こういったアルゴリズム・ライブラリを作成、導入、運用するといった現場レベルでのノウハウシェアについても、かなりのニーズが存在するということをあらためて感じることとなりました。
次回開催も予定とのことですが、こういった機会がますます発展するように盛り上げていければと思います。
参考リンク
こちらの記事のご感想を聞かせください。
- 学びがある
- わかりやすい
- 新しい視点
ご感想ありがとうございました