テクノロジー

2020.03.09

あなたはどんな人? AIが推定したモデルデータを見られるようになりました

トップ画像

こんにちは。Yahoo! JAPAN研究所の坪内です。
ヤフーのデータから、あなたは何に興味を持つ人物と推定されるのでしょうか?

AIの実証実験のために、ヤフーの中で研究開発している門外不出のユーザーモデリングデータ(以後ユーザーモデル)を、本人限定で公開する運びとなりました!
2020年3月9日にYahoo!ラボでリリースしたあなたぐβからご覧いただけます。「小動物を飼っていそう」のような判定結果が見られますので、ぜひ確認してみてください!!
この記事では、その目的や経緯などのアプリの裏側の部分を説明いたします。

あなたぐボードの表示画面

この実証実験について

ヤフーに蓄積されているログやそのログデータを解析した結果というのは、ヤフーを信頼していただき、預けていただいているユーザー自身のものです。
AIによる推定技術により解析した結果を使えば、ユーザー1人ひとりへより大きな利便性を提供できるのではないかと考え、社内の各チームとディスカッションを重ねてきました。
結果、この推定技術の精度を向上させるため、ユーザーの皆さまからフィードバックのご協力をいただく実証実験を行うこととし、そのために開発したのがあなたぐβです。

プライバシーポリシーの範囲内で取得したデータを用いて解析、推定しています

ユーザーモデリングって?

データを分析することで、ユーザーがどんなことに興味があるのか推定できます。例えば、あるユーザーは「カブトムシを飼っていそう」だとか、また別のユーザーは「旅行が好きそうな人だ」などです。これをユーザーモデリングと言います。

ユーザーモデリングの説明図

このユーザーモデルは、ヤフーに蓄積されたユーザーの利用ログデータをAIが解析し、作成されます。例えば、Yahoo!ショッピングでカブトムシグッズをたくさん購入している人だから、「カブトムシを飼っていそう」とか、Yahoo!トラベルを通じて、旅行の予約をたくさんしている人なので「旅行が好きそうな人だ」など推定しています。

もう少し複雑なやり方もあります。

例えば、AさんとBさんは普段の検索内容が似ている人だとします。BさんはたくさんYahoo!トラベルで予約しているので旅行が趣味だと思われます。それに似た検索行動をするAさんも旅行が趣味だろう、と推定する方法です。これを協調フィルタリングといいます。

あくまで人間が直接ログを見て判断するのではなく、またユーザーに尋ねるのでもなく、AIが解析を行い判断し、ユーザーモデルを作っています。ユーザーモデリングは、多くのサービスや商品への興味に対して行われています。

あなたぐβでできること

さまざまなサービスを提供しているヤフーでは、これまでご説明した通り、それぞれのサービスログを用いてユーザーモデルを生成することが可能です。一方で、それらのユーザーモデルはユーザーの一面を表しているものであり、はたしてそのユーザーが他にどのようなことに興味があるのか、全体としてどのような人物なのか、を把握することは困難です。

ヤフーでは、Yahoo! JAPAN IDによって、さまざまなサービスをご利用いただいていることもあり、今回、そのYahoo! JAPAN IDで各モデルをまとめあげることで、「このユーザーはデータによる推定から、どのようなことにいろいろと興味を持っているのか」という問いに答えることができるのではないかと思いました。さらに、そのユーザーモデルをご本人に評価いただくことで、ユーザーモデルを推定するAIの精度をあげたいという思いから開発したのが、あなたぐβです。

なお、あなたぐβのご利用に同意いただいたお客様のみ、各モデルをまとめあげ、ご自身の興味関心の推定結果を一覧でご覧いただけます。あなたぐβでできることは2つです。

1 あなたぐボード機能

あなたぐボードでは下の図のように、あなたの興味とその強さを一枚の絵として作成、表示します。

あなたぐボードの表示画面

あなたぐボードを見るだけで、「あなた」がどのようなことに興味があるとヤフーのAIが推定しているのか、わかります。文字が大きいほど興味が強いと推定されています。実際に生成されたあなたぐボードを見ると、「すごい...当たっている」と思う方も、あるいは「ヤフー全然わかってない!」という方もいるかもしれません。

※あなたぐβの利用に同意いただくと、お使いのYahoo! JAPAN IDによってモデルをまとめあげ、あなたぐボードが生成されます。生成されたあなたぐボードが、外部に提供・公開されることは一切ありません

2 評価機能

2つ目は、あなたぐ評価機能です。ユーザーからいただいた評価をもとにした精度向上を考えています。あなたについている興味タグの当たり外れを評価してみてください。

ヤフーのユーザーの中であなたの興味の強さはどの程度なのか? というのを上位◯%という数値で表現します。

例えば、私が昆虫オタクで、カブトムシを育てたり、昆虫採集に遠出したりするくらい昆虫に興味を持った人物だとします。そこで私の「あなたぐβ」を見てみたところ...

あなたぐβの推定結果の表示画面

「昆虫好き」の予想が「上位0.6%」!!「もう少し高くてもいいのでは? でも、まあ趣味でやっているのだからこの程度だろう...」などと数値を見て感じました。
この興味タグをみて、感じたことをフィードバックできます。感想を下のけんさくとえんじんスタンプの中から選んで、ヤフーにぶつけてください! そのフィードバックによって、精度を向上していきます。

あなたぐβのフィードバックの表示画面

※いただいたフィードバックは、あなたぐβで利用している推定技術の研究開発のためにのみ利用します。本実証実験のために取得したお客様のデータは、実証実験が終了して利用の必要がなくなりましたら速やかに消去します

※評価いただくことで、日頃ご利用いただいているヤフーサービスがご利用いただけなくなったり、サービスの内容がすぐに変わったりすることはございません。また、表示される興味タグに対して評価がすぐに反映されるものではありません

"とんちんかんなレコメンド"を減らすために

今回は正式なヤフーアプリとして公開ではなく、実証実験という立場のYahoo!ラボ内での公開ですが、たくさんの方に使っていただき、ヤフーのデータでみなさんがどのように推定されているのか確認いただきたいと思います。

この実証実験や評価機能の中でいただいたフィードバックをもとに、よりユーザーの興味を正しく推定する手法は何が最適なのかを考えていきます。的確な興味やユーザーの状態を推定できれば、ユーザーにも"とんちんかん"なレコメンドやアナウンスを減らすこともできるはずです。

それに何よりも、ヤフーの興味推定AIを一緒に育て、より良いサービスにしていく感覚もユーザーの方々に味わっていただけるのではないかと考えています。ぜひ、どんどん評価いただき、フィードバックしていただければうれしいです。

まとめ

10年ほど前まではいわゆる"ルールベース"で、情報提供のやり方を決めていました。単純に、「ビールの広告をクリックした人だからビールが好きだろう」のようなやり方です。

今は、機械学習を活用し、"ログベース"で情報提供をしています。ログを解析し、「こういう行動をした人たちは、すごくビールが好き」という推定です。ルールベースでは拾いきれない多くのモデルを学習し、ルールベースと比べると格段にユーザーの興味に即した情報提供が実現できました。しかし、これでユーザーの興味をバッチリ推定できているかと言われると、残念ながらまだまだなのです! さらに皆様から評価をいただくことで、推定技術を賢くし、Yahoo! JAPANサービスの改善に役立てていくことができます。

これからは、情報の透明性の流れに乗り、さらに細やかなシグナルを拾い上げ、ユーザーに的確な情報提供を実現していく時代です。ユーザーの皆様に満足いただけるほどの的確な情報提供は、大変チャレンジングで大きな青写真と言えます! その大きな青写真を描く上で、"ユーザーのみなさんと一緒に作り上げていくこと"というのは必須の要件になってきます。

今回のあなたぐβが、大きな目標に向けた第一歩になれば、と考えています。ぜひ、あなたがどのようなことに興味があるとヤフーのAIが推定しているのか? あなたぐβで確認してみてください! そして、少しでも共感いただけましたら、「#あなたぐ」でつぶやいていただけたら幸いです。よろしくお願いします!


坪内 孝太
Yahoo! JAPAN研究所

Yahoo! JAPANでは情報技術を駆使して人々や社会の課題を一緒に解決していける方を募集しています。詳しくは採用情報をご覧ください。

関連記事

このページの先頭へ