[レポート] 第3世代BI Lookerの魅力とは(Looker 蓮池 拓哉 氏) – Developers.IO 2019 in TOKYO #cmdevio

今年に入り、日本各地で開催を行っている弊社主催の一大カンファレンス『Developers.IO 2019』。ここまでの開催記録は下記シリーズにてまとめております。

そして2019年11月01日(金)、イベント最大規模となる東京会場にて『Developers.IO 2019 TOKYO』が執り行われました!!

当エントリでは、その中からLooker 蓮池拓哉氏によるランチセッション『第3世代BI Lookerの魅力とは』の内容についてレポートしたいと思います。

目次

 

セッション概要

登壇者情報は以下の通り。

  • 蓮池 拓哉氏/Looker ソリューションコンサルタント

蓮池氏は先日公開した下記インタビューブログでもお話させて頂きました。

 

セッションレポート

蓮池氏には、イベントの『ランチセッション』の時間でお話頂きました。

 

自己紹介・企業紹介

  • 自己紹介
    • 前職(BI系の企業)で導入提案等を行っていた際、Lookerの存在を知る。
    • これまでに感じていた課題や問題点等をlookerが日本に来るタイミングで知り、『自分が思っている課題を解決出来そうだ』と思い、今年2019年4月にLookerに入社。
  • Lookerってどんな会社?
  • お客様
    • グローバルなお客様:データをうまく活用しているという印象がある。
    • 国内のお客様:下記は許可を頂いているお客様の情報、実際は利用頂いている企業数はもう少しある。キャッチーなところだとメルカリ、ZOZOなど。会社の業態・業種関わらず増えて来ている

  • Lookerのミッション
    • Lookerのミッション:『データをよりスマートに活用する事によって、ユーザーがより多くのことを行えるようにする』。
    • "うち、もうデータ活用出来ているんですよ"と話すお客様、実際聞いてみると可視化・視覚化で留まっているというところも多い。→データ分析の民主化を考えると、視覚化がゴールか?
    • データエンジニアリングというところを考えると、データ活用、視覚化というフェーズは一部分でしか無い。
    • Lookerは視覚化を含む、青い部分の20%の部分をしっかりやっていく、サポートするというプロダクト。

  • 『データ分析の民主化』の前提:データソースが変化し、ボリュームや利用者も増え、データの活用方法も変化する。これを念頭に我々はビジネスを行っている。

 

第3世代BIとは何か

  • 第1世代のBI
    • 単一構成のBI。Microstorategy, Cognos, Oracle BI等のレガシープロダクト
    • ETLツールをつかってDWHの中にデータをため、多次元キューブを作ってサーバで処理し描画
    • 高度なことも出来るが対応が難しかったり、手間が掛かる
  • 第2世代のBI
    • セルフサービス、デスクトップBI。
    • ネットが発展し、活動がインターネット上で為されるように。
    • デジタル経済加速に伴いデータ量が膨大になるにつけ、やりたいことも増えていく。
    • 今まではETLツール経由で集まったデータを、コネクタを使ってデータに接続
    • 以前は高価だったが、インメモリ型の処理が出来るようになってきて処理も高速化した→簡単にUIでデータを撮ってきて処理をして描画出来るようになった→データ利用の人たちの種類が変わって・増えてきた世界に
    • 皆がデータを使うので、ガバナンスが効かなくなる。自分の思い思いにデータを集めて指標を作ってしまう→データ共有した時に定義のズレが発生してしまうことは良くある
    • BIツールの処理基盤にデータを持ってこなければならない
  • クラウドとBI
    • クラウドデータベースが発展、高速スケーラビリティ安価なDWHが使えるように
    • そっち(DWH)側にデータをボンボン貯めていく→インメモリ側の処理基盤が相対的に弱く・処理が遅くなる状況に
    • 大量データを分析する状況が難しい時代に
  • パイプラインの変遷
    • 昨今、SaaSのアプリケーションが増えている
    • そして、データの扱いもリアルタイム性が増してきている。この状況に対応/ビジネスユーザーが変わって新しい質問に応えるためには、対象となるデータを都度ETLツールで対応するデータを作り直して...ということが難しくなってくる状況に。
    • 最新のETLパイプラインに求められるもの:比較的緩めにデータを貯めていった状態で、そこに対し、自由に分析したい軸に合わせてSQLを色々な角度で生成し、色んなパターンで、ビジネスユーザーの問い合わせに対応していく。Lookerではそんな環境に対応する仕組みが整っている

 

なぜLookerなのか?

Lookerの特徴は以下の3つ。

1.データのアップロードが無い

  • データソースが変化し、増加することを前提とした対応を取ることを行っている
  • 第1、第2世代は『自分たちの環境でデータを処理する』ことを考えている
  • 一方Lookerは『データ処理はお持ちの高性能DWHにお任せするので、Lookerにはそこで処理した結果をください』というスタンス。
    • データを貯めているRedshiftでは高速に結果が返ってくるのにデスクトップ環境が貧弱なので...みたいなのを避ける
    • 個人情報の取り扱い、観点からしても(データを持ってこないので)安全

2.LookMLでデータロジックを一元管理

  • 第2世代BIはデスクトップツールが主流、ライト&アドホックに出来るようにはなった
  • 反面、データやエンジニアリングに対する理解が正しくないと、一貫性の担保が難しくなってきた
  • 一貫性が保てなくなるとデータの信頼性も低下→ビジネスの意思決定に活用することにもリスクとなる
  • LookerはLookMLを使ってデータロジックを一元管理することで、データの一貫性を担保しながら、品質を上げていくことが可能になっている。
  • LookMLを使うことで、シンプルにメンテナンスコストを下げていくことも期待出来る。

3.共有・コラボレーション

  • Lookerではデータの活用方法を変えていくことを提唱している
  • LookerはWebベースのSaaSのソリューション。色々なツールと簡単につなぐことが出来るようになっている
  • 可視化だけでは無く、既にお持ちの業務アプリケーションと連携し、Lookerを用いたデータ分析を皆さんの業務フローの中に組み込んでいくことが出来るようになっていく。

 

Lookerデモ実演

Lookerに関する特徴等を紹介した後は、実際にサービスを使いながらLookerの機能や良さについて説明するデモを行いました。

  • 可視化は想定されるようなケース、Lookerでも大体のことは出来る
  • 可視化だけにとどまらず、『次のアクション』が行えるような仕組みも多数扱える(デモではEメール展開、Slack連携などを実践)
  • データセットを移動して探索/Explore(探索)機能を使って分析アクションの展開
  • LookMLの解説
    • ビューファイル=モデル定義
    • モデルファイル=ビューをどのように扱うのか
    • 再利用や拡張を意識した作り
    • Gitリポジトリとの連携で定義をバージョン管理出来る
    • LookMLの仕組み自体は非常にシンプル。SQL毎の方言の違いも吸収出来る(LookML側でやってくれる)ので、LookMLを覚えるメリットは非常に大きいと言える

 

セッションまとめ

  • データ活用方法は移り変わる。データソースも利用者も変わる
  • データの可視化はゴールではなく、出発点。過去データを見て終わりではなく、正確なデータをリアルタイムに捉え、サービスへ転換
  • ツールにワークフローを寄せるのではなく、理想的なワークフローにツールを寄せる

  • Lookerのアプローチ

    • Lookerはデータを貯めているところに対して、横たわるような形で『アジャイルモデリングレイヤー』として存在、Lookerはあくまで各データソースに対してデータを取得しに行く、SQLを発行しにいく『SQL発行屋さん』。発行した結果を、様々なデータ活用方法で連携/展開していく。

 

Lookerブース

今回のランチセッションと合わせて、Looker社様にはイベントブースフロアにてブースも頂いておりました。

当日は多くのお客様にお越し頂き、Looker社の皆様も各種説明や問い合わせ対応等を行っておられました。(※以下、セッションの合間にお邪魔した時の写真です)

 

まとめ

という訳で、Developers.IO 2019スポンサーセッション、Looker蓮池様による『第3世代BI Lookerの魅力とは』のレポートでした。当日御覧頂いた皆様としては、Lookerのスタンスやビジョン、また実際に動いているLookerの画面を見ることでイメージが膨らんだ部分もあるかと思います。関係者の皆様、ありがとうございました!