12月
4
Apache Arrow - データ処理ツールの次世代プラットフォーム
日本OSS推進フォーラム アプリケーション部会 第10回勉強会
主催 : 日本OSS推進フォーラム アプリケーション部会
イベントの説明
概要
OSSをITに活用したい技術者および技術者を目指す総ての人々を対象とした、技術力向上を目的とした技術セミナです。
今回は、プログラミング言語Rubyや全文検索エンジンGroongaの開発、およびOSS Gateの主催者としても著名な須藤功平様を講師にお迎えし、データ処理プラットフォームのApache Arrowについてお話いただきます。
講演内容
みなさんはApache Arrowを知っていますか? 普段データを処理している人でも今はまだ知らない人の方が多いかもしれません。 しかし、数年後には「データ処理をしている人ならほとんどの人が知っている」となるプロダクトです。 (そうなるはずです。)
Apache Arrowはメモリー上でデータ処理するときに必要なもの一式を提供します。 たとえば、効率的なデータ交換のためのデータフォーマット、CPU/GPUの機能を活用した高速なデータ操作機能などです。
一部のデータ処理ツールではすでにApache Arrowを使い始めています。 たとえば、Apache SparkはApache Arrowを活用することでPySpark(PythonからApache Sparkを使うためのモジュール)とのやりとりを高速化しています。 データ量によっては10倍以上も高速になります。 (リンク先の例では20秒→0.7秒と約30倍高速になっています。)
この講演ではApache Arrowの概要だけでなく最新情報も紹介します。 この講演を聞くことでApache Arrowのことを網羅的に把握できます。
Apache Arrowはデータ処理ツールが共通で必要なもの一式を提供するので、より多くのツールがApache Arrowを活用し、より多くの人がApache Arrowの開発に参加すると、より多くの人が豊かになります。 Apache ArrowはOSSなのでだれでも自由に活用したり開発に参加したりできます。 Apache Arrowのことを知ってOSSならではの「共有するほど豊かになる」アプローチに参加しましょう!
参考URL: Apache Arrowの最新情報(2018年9月版)
講師紹介
Apache Arrow PMC(*)メンバー。唯一の日本人メンバー。
(*) Project Management Commitee。プロジェクト管理チームみたいな感じ。
Apache Arrow以外にもプログラミング言語Rubyや全文検索エンジンGroongaなど様々なOSSの開発に参加している。
ユーザーが自由に使えるソフトウェアでビジネスをしている株式会社クリアコードの代表取締役。
タイムテーブル
時間 | 概要 |
---|---|
17:30 | 開場 |
18:00-19:00 | 講演「Apache Arrow - データ処理ツールの次世代プラットフォーム」 |
19:00-19:30 | 質疑応答 |
19:30 | 閉会 |
申し込み時のご注意
参加申込み時、以下の情報の入力を求めるアンケートが表示されます。
ご入力いただいた情報は、当日の会場への入館処理にのみ利用し、セミナーの終了後すみやかに破棄いたします。
- 所属企業名(企業に所属されていない方は、「学生」「無所属」等ご記入ください)
- お名前
- メールアドレス
日本OSS推進フォーラムについて
日本OSS推進フォーラムは、情報システムのユーザー、ベンダー、学識経験者の有識者が参集し、OSSの活用上の課題について、自由な立場で議論し、課題解決に向けての取組みを行っている団体です。
詳しくは、日本OSS推進フォーラムのホームページをご覧ください。
また、日本OSS推進フォーラム Facebookページ への「いいね!」もよろしくお願いいたします。