2009年6月10日

「サーチのなかみ」でわかる検索ワードのウラオモテ

  • このエントリーをはてなブックマークに追加

こんにちは。検索プラットフォーム開発の八木です。
今回は本日リリースされました「サーチのなかみ」についてご紹介させていただきたいと思います。


■どんなサービス?
「サーチのなかみ」は、あるクエリに対して、都道府県別、男女別、年代別、職業別、時間別にどのくらい検索されているかを分解し、関心度をわかりやすくビジュアル化したサービスです。
一目でその温度差を理解できるのでそのワードに付随する人物像や背景、ユーザー欲求などを的確に読み解くことが可能となります。
「サーチのなかみ」には都道府県別の切り口から見る「地域別」のページと男女別、職業別、時間別の切り口から見る「性年代別」のページがあります。


■どうやってみたらいい?
今回はこちらがあらかじめ検索ワードを決め、静的なページで提供しています。
採用しているワードは2種類あり、

Yahoo!検索ランキングの検索総数ランキングのデイリーのワード
・季節性や地域性を勘案したオススメキーワード

それぞれ100語、合計200語になります。

検索総数ランキングのワードは、あくまで「総数」の方なのであまり地域別を見てもそれほど違いは現れないかもしれません。
急上昇しているワードを中心に、「性年代別」を見ていただくのがオススメかと思います。
性年代別は、男女別、年代別、時間別、職業別に分けて集計しているので、なぜこのワードがランキングに入っているのか、どのような人が多く検索しているのか、なぜこの時間に検索が多いのかなど、より多く検索している人物像や背景が分かるかもしれません。
また、トレンドサーフィンのページでは、このデータを利用した記事が書かれるかもしれませんので、要注目です。


オススメキーワードは、地域別、性年代別どちらか、またはその両方に特徴が見られるようなワードを選びましたが、その中でも季節性のある「梅雨」や「水着」のようなワードがオススメです。
季節性のあるワードは一定期間見続けるとその変化が顕著に現れます。
以下、4月中旬から5月初旬にかけての「桜」の地域別の検索比率の変化です。(中途半端な時期で申し訳ありません)


  • 4月16日
  • 4月23日
     
  • 5月6日
     

桜前線の上昇とともに「桜」を多く検索している地域も北上しているのが分かります。

以上、2つの見方を紹介しましたが、さまざまな視点からこのサービスを見ていくと、意外な発見があるかもしれません。


■もう一人の開発者
このサービス自体は、もともと、Iさんにより、社内用クエリ分析ツールとして開発されたものですが、今回、私がそのツールを一般公開用にするために開発を担当しました。

そこで、ツールの生みの親であるIさんに、当時の開発秘話などを伺いました。


◇開発したきっかけは?

  • 地域別
    検索アクセス元を都道府県レベルでのおおよその判別ができることから、あるワードに対する検索数が都道府県別にどのくらい違いが出るのか、また、バーストワードについても違いがでるのかを見ることができたら面白いなと思いました。
    また、それによって、同じものでも地域によって違う表現をしている言葉、たとえば、マクドナルド(「マック」と「マクド」)や、「ラーフル」(黒板消し:九州ではそう呼ばれているらしい)など、ワードによる地域性がはっきり分かったらおもしろいなと思って開発しました。
  • 性年代別
    これは、Yahoo! JAPAN IDに登録された情報を用いているのですが、この情報を用いて、このワードはどのような人が検索しているのか、その人物像や背景が分かったら興味深いなと思いました。
    ただ、Yahoo! JAPAN IDをお持ちの方ならお分かりとは思いますが、職業などはかなり細い業種まで細分化されています。
    そのまま細分化された状態で見せるべきか、また、どのように集計し、どのような切り口で見たらいいのか、その切り口にどのような優先度が存在するのかなどをさまざまな影響を考慮に入れなければなりませんが、今回は、まず大きなセグメントに分けて傾向を分析しようと考え、このような形での開発となりました。

◇発想・開発のポイントは?

  • 地域別
    作ってみて思ったことは、検索数だけで都道府県別に集計していくと、どんなクエリでも人口の多い東京、神奈川、大阪辺りが必ず1〜3位に位置していて、うまく比較できませんでした。
    そこで、クエリに対する都道府県別の検索割合を算出してスコア化することによって、各都道府県を相対化してみせることに成功しました。
  • 性年代別
    時間別では横軸が1時、4時、7時...と1時から3時間単位で区切っていますが、これは実は3時間ごとの集計値です。
    つまり、1〜4時、4〜7時...の集計値になっています。1時間ごとに24時間の集計値では切り口としては多すぎる気がしたので、3時間毎で8つの切り口から見ることにしました。
    また、0時〜にせずに1時〜にしたのは、それぞれを比較した結果、7時〜10時は出勤時間前後とか、1時〜4時はアダルトクエリが多いとか、1時〜の方がまとまりがあったのでそちらを採用しました。

◇感想をお願いします
年代別の検索ワードの傾向を見てみると、20代までは簡単で意味も分かりやすいワードが多く見られますが、30代、40代になると、難解なワードが多く検索されているようです。
そして、50代になると再び簡単なワードが多くなるという傾向が見られました。
「年を取ると子どもに戻る」といわれますが、検索ワードもそのような傾向が見受けられ、非常に検索ワードの奥深さを感じました。


最後に、今後の展望について僕から話させていただきますが、まずはやはり、検索窓をおいて自由にワードを検索できるようにしていきたいですね。
現在は200語で、それでも楽しめるとは思いますが、やはり自分で好きなワードの「なかみ」が調べられた方がより楽しめると思います。
地域別、性年代別にみていきますと、地域別に関しては、桜や花粉など、季節性、遷移性のあるワードをある期間で動的に見せられたり、同じもの指していても地域別に表現の仕方が異なるワードを一度に見せられることができたら面白いと思います。
また、性年代別に関しては、まずはこの切り口でいいのかもう少し検証が必要かもしれません。その後にこの情報を元に何か別のプロダクトにもつながっていってくれればと思います。



  • 「サーチのなかみ - 地域別」についてのご意見・ご感想はこちら
  • 「サーチのなかみ - 性・年代別」についてのご意見・ご感想はこちら

Yahoo! JAPANでは情報技術を駆使して人々や社会の課題を一緒に解決していける方を募集しています。詳しくは採用情報をご覧ください。

  • このエントリーをはてなブックマークに追加