【登壇情報】ゼロから始めるSparkSQL徹底活用！

エンジニアの登壇情報が公開されました！

ゼロから始めるSparkSQL徹底活用！ ～Sparkのインストールから、 SparkSQLの概要紹介実務で活用するためのノウハウまでを紹介します～

日時：2017年3月21日 (火) 19:30 ～
場所：レバレジーズ株式会社　＠渋谷ヒカリエ

ビッグデータ部の加嵜がお話させていただきます！

詳細は下記リンクよりご確認いただけます！皆様のご参加おまちしております！

以下ATNDより抜粋

★講演内容

みなさんは、SQLを使ってデータの加工や分析をする際、「計算途中のデータを確認しながらクエリを書けたら良いのに・・・」「同じようなコードが何度も出てきている箇所を一つにまとめたい・・・」などと思ったことはありませんか？今回紹介するSparkSQLは、SQLとSparkの機能を統合させることで、これらの悩みを解決してくれます。

Spark(Apache Spark)とは、HadoopのMapReduceに続くオープンソースの分散処理フレームワークです。これまでのオープンソースのプロダクトと比べても、非常に早いスピードで開発が進んでいるプロダクトであり、機械学習やグラフ処理、リアルタイムストリーミング処理など、さまざまな処理を手軽に分散処理できる機能を提供しています。

今回の発表では、スタンドアロンモードでのSparkのインストールから、 SparkSQLの概要紹介、実務で活用するためのノウハウまでを紹介します。実務的なデータ活用のデモとして、ECサイトにおけるABC分析、サイト検索機能のログ分析などを扱います。

まだSparkに触れたことのない人から、 Sparkの活用方法がいまいちピンとこない人、現状のデータ分析環境に不満を持っている人まで、今回の発表でSparkSQLの魅力に触れていただければと思います。

※ 内容は変更になる可能性があります。