OSSカテゴリの記事一覧

2019年2月21日

Apache Hadoop Contributors Meetup出張報告(後編)

OSS WEEKの4日目の記事です。カテゴリの一覧はこちら 本記事は前編に続いて出張報告の後編です。後編はデータプラットフォーム本部の浅沼が担当します。この記事ではMeetUpの様子と、MeetUpで発表があった新機能のRouter-based Federationについて詳しく紹介します。

全て読む

2019年2月20日

Apache Hadoop Contributors Meetup出張報告(前編)

OSS WEEKの3日目の記事です。カテゴリの一覧はこちら 本記事では最初にYahoo! JAPANでApache Hadoop(以下Hadoop)コミッタが普段どのような活動をしているか紹介します。また、1月末にシリコンバレーで開催されたApache Hadoop Contributors Meetupに参加してきたので、meetupで発表があった新機能のうち特に注目している機能を2件紹介します

全て読む

2019年2月19日

ヤフーにおけるOSS開発・貢献がどのように行われているか

OSS WEEKの2日目の記事です。カテゴリの一覧はこちら はじめに こんにちは。システム統括本部プラットフォーム開発本部の古田です。 私は、ヤフー株式会社(以下、ヤフー)が採用しているOSSの1つである、Apache Pulsarを扱うチーム(以下、Pulsarチーム)に所属しています。今回は、ヤフーにおけるOSS開発・貢献がどのように行われているかについて紹介します。

全て読む

2019年2月18日

OSSウィークを開催します

OSS WEEKの1日目の記事です。カテゴリの一覧はこちら はじめに こんにちは。テクノロジーグループCTOの服部です。 突然ですが、今年は毎年行っているアドベントカレンダーに加えて、OSSウィークというものを実施いたします!!OSSに関わる弊社のエンジニアが1週間かけて、入れ替わりでOSS活動に関する記事をアップしていきます。 記念すべき初日は、ヤフーにおけるテクノロジー選定とOSSに貢献す

全て読む

2019年1月21日

'Recent purchases' with Apache Ignite

Apache Ignite導入の体験レポート Roman Shtykh (Data and Science Solutions Group, Apache Ignite committer) @rshtykhToru Yabuki(Shopping Services Group, Commerce Company) Yahoo!ショッピングは、ユーザが買い物を楽しむために様々なサービスを提供する日

全て読む

2018年12月26日

ヤフー発の OSS 、Multiple-Dimension-Spread(MDS)の紹介

はじめに こんにちは。 ヤフー株式会社 データ&サイエンスソリューション統括本部データプラットフォーム本部データデリバリー部の井島&大戸です。 今回は、ヤフー株式会社(以下ヤフー)が OSS として公開したカラムナストレージファイルフォーマットの Multiple-Dimension-Spread について、開発の背景を交えて紹介します。

全て読む

2018年11月 1日

Yahoo!ショッピングのレポート機能にApache Kylinを導入した事例紹介

はじめに こんにちは。データ&サイエンスソリューション統括本部データプラットフォーム本部の蔵元&古山です。今回は、Apache KylinをYahoo!ショッピングのレポート機能に適用した事例を紹介します。 なお、この事例はApache KylinのPowered Byページに以下のように記載しているものの詳細版です。 Yahoo! JAPAN uses Apache Kylin to gener

全て読む

2017年9月27日

The open big data serving engine:VESPAの紹介

はじめに こんにちは。メディアカンパニープラットフォーム開発本部サーチテクノロジー部の朴と申します。2017年9月にOath(Verizon社で、Yahoo, AOL等50以上のテクノロジーとメディアを運営する子会社)からVESPAがOSSとして公開されました。VESPAは検索エンジンを代表とした大規模なデータをハイトラフィック状況下で高速に配信できるビッグデータサービングエンジンです。実はYah

全て読む

2017年7月27日

Apache Ignite新メモリアーキテクチャ

シュティフ ロマン(データプラットフォーム)Apache Igniteコミッター@rshtykh はじめに 近頃、急激に増量していくデータはもはやタイムリー且つ正確なデータ処理を困難にする。そのような中で、複雑なETLを無くしてコストを削減でき迅速なデータ処理の可能性を実証するインメモリコンピューティング技術が注目されている。例えば、2015年からスタートしたIn-Memory Computing

全て読む