2009年6月15日

Yahoo!ニュース

新しくなったトピックスAPIの紹介

  • このエントリーをはてなブックマークに追加

こんにちは。トピックスの開発の長岡と石森です。

6月15日にニュースWeb APIで提供しているトピックスAPIのバージョンアップ、および新規APIの追加を行いました。
トピックスというのは、皆さんがYahoo! JAPANトップページの中央部分などで目にする、ニュースの短い見出しを提供しているサービスです。トピックスでは、これまでもこの見出しをAPIで提供してきましたが、今回は「出せるものは全部出す」という方針のもと、大幅に情報を増やし、3つのAPIを提供することにしました。これから、それぞれのAPIのコンセプトや主な使い方をご紹介します。

【今回提供するAPI】

今回提供する3つのAPIは以下です。1つめのAPIはこれまでも提供してきたもので、今回はバージョンアップをします。2つめと3つめが今回新しく提供するものです。

    1.トピックスAPI
    2.トピックス見出しアーカイブAPI
    3.トピックスアーカイブAPI

3つのAPIについて説明する前に、まずトピックスというサービスの仕組みについて簡単に説明します。

トピックスでは、編集部員が毎日約3,500にもおよぶ記事のなかから世間の関心を呼びそうな記事を50〜60本選び、1,300個ほどあるトピックという話題の単位に分類しています。さらに、分類した記事に、関連記事や解説記事などをつけて、経緯や全体像が分かりやすいようにしています。選んだ記事は13文字程度の分かりやすい見出しをつけてYahoo! JAPANトップページなどで紹介しています。

いわば、トピックという話題ごとの箱のようなものがあり、そのなかに新しい記事が入るたびに見出しや関連する情報が追加・更新されていく、という仕組みになっています。これをなんとなく頭に入れて以下の説明を読んでいただくと、どのような情報が取得できるのかがイメージしやすいかと思います。

1.トピックスAPI

トピックに関する最新の情報を提供します。そのトピックに新しい見出しがあればその見出しも提供します。今回は、昨年夏に追加した「関連情報エリア」の情報も提供するようにしました。また、レスポンスの開始位置を指定することで、全部の情報を取得できるようにしました(これまでは最大30件までしか取得できませんでした)。

詳しい使い方はデベロッパーネットワークのトピックスAPIをごらんください。

2.トピックス見出しアーカイブAPI

過去に提供した見出しやその見出しにアクセスした人数などの情報を提供します。トピックにある見出しは新しいものに上書きされていくため、過去の見出しは1つめのトピックスAPIでは取得できません。過去の見出しの情報を取得するにはこのAPIを使ってください。

詳しい使い方はデベロッパーネットワークのトピックス見出しアーカイブAPIをごらんください。

3.トピックスアーカイブAPI

トピックに関する過去の情報を提供します。特定のトピックが編集された回数やアクセスした人数などの情報を提供します。トピックに関する過去の情報を取得するにはこのAPIを使ってください。

詳しい使い方はデベロッパーネットワークのトピックスアーカイブAPIをごらんください。

【開発上の配慮など】

PV指標の算出

トピックスのPV(PageView/アクセス数)が、どれくらいなのかが気になる人は多いのではないでしょうか?
今回提供する3つのAPIではPV指標を提供します。
トピックスでは、表示系サーバーと呼んでいるウェブサーバーが多数稼働しています。
そのなかの数台にアクセスログを解析しデータベースへデータを入れ込むプログラムを組み込み、アクセスが発生したトピックのPVのデータを1分おきにデータベースへ書き込んでいます。
このデータ保存のために利用しているシステムはトピックスエディター(関連情報エリアの編集者)の書き込みの際に使用している仕組みです。
これにより、ほぼリアルタイムでのAPIへの数値反映を実現しています。

データベース

トピックスでは昨年夏のリニューアルの際にデータベースのテーブル構成を見直し、大きく「トピック系」と「Wiki系」に切り分けました。
トピック系は編集部員が入稿するデータであるヘッドライン情報やバックナンバー、ニュースのデータがメインで、Wiki系は関連情報のWiki文法およびバージョンのデータがメインです。

今回提供するAPIではこれらのメインとなるテーブル内の情報をほぼすべて参照し、過去から最新の情報まで提供しています。
トピックスではWiki文法からHTML形式へとコンバートするWiki文法解釈プログラムを実装しているのですが、トピックスAPIにおいてはWiki系テーブルを参照し、最新の掲載データをユーザーが書き込んだ文法そのままの形で出力しています。
ぜひ、Wiki文法解釈プログラムの開発を行ってみてください。

【最後に】

いかがでしたでしょうか。これらのAPIをうまく組み合わせれば、専門サイトにニュースを添えたり、特集サイトで過去の出来事を振り返ったりできます。また、社会調査のようなものにも使えます。われわれでは使い切れていない面もあるこれらのデータの、面白い使い方が登場してくれることを期待しています!



Yahoo!デベロッパーネットワーク - ニュースAPI
Yahoo!デベロッパーネットワークはこちら
APIをご利用前にアプリケーションIDの取得を忘れずにお願いします。 登録はこちら

Yahoo! JAPANでは情報技術を駆使して人々や社会の課題を一緒に解決していける方を募集しています。詳しくは採用情報をご覧ください。

  • このエントリーをはてなブックマークに追加