DMM.comラボエンジニアブログ

DMM.comラボのエンジニアブログです。DMM.comを支える技術について書いています。

DMM insideに引っ越しました。 移転先はこちら -> https://inside.dmm.com/

【登壇情報】ゼロから始めるSparkSQL徹底活用!

エンジニアの登壇情報が公開されました!


ゼロから始めるSparkSQL徹底活用!
~Sparkのインストールから、 SparkSQLの概要紹介
実務で活用するためのノウハウまでを紹介します~

日時:2017年3月21日 (火) 19:30 ~
場所:レバレジーズ株式会社 @渋谷ヒカリエ

ビッグデータ部の加嵜がお話させていただきます!

詳細は下記リンクよりご確認いただけます! 皆様のご参加おまちしております!

atnd.org

以下ATNDより抜粋

★講演内容

みなさんは、SQLを使ってデータの加工や分析をする際、 「計算途中のデータを確認しながらクエリを書けたら良いのに・・・」 「同じようなコードが何度も出てきている箇所を一つにまとめたい・・・」 などと思ったことはありませんか? 今回紹介するSparkSQLは、SQLとSparkの機能を統合させることで、 これらの悩みを解決してくれます。

Spark(Apache Spark)とは、HadoopのMapReduceに続く オープンソースの分散処理フレームワークです。 これまでのオープンソースのプロダクトと比べても、 非常に早いスピードで開発が進んでいるプロダクトであり、 機械学習やグラフ処理、リアルタイムストリーミング処理など、 さまざまな処理を手軽に分散処理できる機能を提供しています。

今回の発表では、スタンドアロンモードでのSparkのインストールから、 SparkSQLの概要紹介、実務で活用するためのノウハウまでを紹介します。 実務的なデータ活用のデモとして、ECサイトにおけるABC分析、 サイト検索機能のログ分析などを扱います。

まだSparkに触れたことのない人から、 Sparkの活用方法がいまいちピンとこない人、 現状のデータ分析環境に不満を持っている人まで、 今回の発表でSparkSQLの魅力に触れていただければと思います。

※ 内容は変更になる可能性があります。

★講演者プロフィール

■加嵜 長門 氏

株式会社DMM.comラボに所属。 大学院やスタートアップ企業で、 マルチメディアデータベースを対象とした検索や レコメンドアルゴリズムの研究を行う。 現在はDMM.comラボにおいて、 Sparkを用いた行動解析やレコメンド基盤の研究開発を行う。

共著に『詳解Apache Spark』(技術評論社)、 『ビッグデータ分析・活用のためのSQLレシピ』

詳細はヒカ☆ラボのイベントページをご確認ください!

atnd.org