Bonfire Data Analyst #2 に参加してきた ( テーマ:データの可視化 ) #yjbonfire
今年6月末に第1回が開催されたヤフーさん主催の「Bonfire Data Analyst」。
この度、第2回のイベントが開催されていたので「ブログで感想枠」にて参加してきました。当エントリはその参加レポートとなります。
目次
イベントレポート
開催会場はヤフー株式会社 LODGE@紀尾井町。
広大(マジ広かった!)なフロアの一角に設けられたスペースを利用する形でイベントが進められました。
イントロ&乾杯
まずはじめに、ヤフー株式会社 藤木 貴之氏より乾杯の挨拶とイベント諸注意やイベント趣旨に関しての説明がありました。『Bonfire』はヤフー主催の技術コミュニティであり、今回開催のシリーズ『Bonfire Data Analyst』はデータアナリストが情報や課題を共有する場として催されているものとなります。運営メンバーはデータ分析従事者で構成されています。
今回のテーマは『データの可視化』。現場でどの様に可視化を進めているのか、データの可視化の質を上げるために何をすれば良いのか、という点について計3名の登壇者に発表頂く形となりました。
ベンチャーから始めるデータの可視化
- 登壇者:吉田 裕宣 氏(株式会社HR Force データアナリスト)
2018年設立のベンチャー企業である株式会社HR Forceは広告・運用・アドテクの会社。設立から1年半が経った現在では社員規模48名、アルバイトやインターンまで含めると150名という急成長を遂げています。その裏で「『データ準備』という観点では大変なところだらけだった」と吉田氏。
社員数6名で始めた会社、当初はそもそも「データがない」という状況。そもそも「データをどうやって集めるか」というところから手探りで進めていかねばなりませんでした。組織の立ち上げとともに、データの正規化やクレンジングといった「データの整備」を行い、分析を行うためのデータが集まる会社を作るのが初期フェーズのタスクとなりました。
フェーズ別の可視化環境についても、社員数の規模や社員がフォーカスする目標・目的に応じてツールや環境をシフト。
- 可視化については創業当時に関しては全然着手出来ていなかった
- 当初はサーバに蓄積しようと思ったけどカラム構造が頻繁に変わるので断念、スプレッドシートに集約する形としていた→でも容量が足りなくなる
- 10名規模:Tableau導入。Tableauは良いツールだが、ツールの特性もあるので用途に応じて使い分けている
- 10名規模の時点では『会社の数字に興味を持っている』メンバーが主。
- 30名規模:Google Data Portalを導入。この時点では『目の前の事業にフォーカス』したい人はGoogle Data Portal、『数字に興味がある』人にはTableauを推してた
- その後はSalesforce導入へ
吉田氏曰く、目的や対象ユーザーによって使い分けている各種可視化ツールには以下のような特色・特徴があるとのこと。吉田氏としては、今後は「雑談や日常会話の中にデータを組み込めないか」と考えているそうです。
ヤフーにおけるデータの可視化
- 登壇者:前側 将 氏(ヤフー株式会社 データアナリスト)
BIツールコンサルから幾度かの転職を経て現職に就いた前側氏。現在ではTableauの良さを発揮させて依頼者の可視化・分析リテラシーを向上させる事に注力されているそうです。その前側氏曰く、可視化の課題には種類があるとのこと。
- 数の課題
- ガバナンスの課題
- 質の課題
- サスティナブルの課題
- 基盤の課題
また、それら課題は以下の3つに切り分けることが可能である、と説明しました。「運用の問題」に関してはLookerを使って解決しようとしている、とも言及していました(この辺ちょっと気になる...)
- 文化の問題(数と質)
- 運用の問題(ガバナンス、サスティナブル)
- システムの問題(基盤)
前側氏はまた、「データ活用の文化醸成については、Tableauは最適なツールである」と強調。「Tableauはレゴと一緒。アート性や表現力が高く、誰でも扱うことが出来る。データの発想力を育むことが出来、データドリブンな環境を作り上げるスタートを切ることが出来る(Tableauで裾野を広げ、ユーザーを増やし、SQLやライブラリ、機械学習といった上記レベルのスキルセット取得・向上へ繋げることが出来る)」とその特徴について解説していました。(この部分に関しては個人的にも同意。基本的な部分であればドラッグアンドドロップで操作出来るというハードルの低さ・使いやすさはどのツールよりも抜きん出ていると思います)
前側氏のセッションでは質疑応答でも興味深いコメントを聞くことが出来ました。以下抜粋です。
- Q.Looker vs Tableauについて聞きたい。Yahooではどちらが最適?
- A.どちらというのは無い。例えば「SQLが使えない」という場合であればTableauしかないと思っている。また、Tableauだと「仕様や定義の管理が出来ない」という課題があるので、そういった課題を抱えているところではLookerも良いのではと思っている。
- Q.マーケ層へのTableauの教育はどうやっている?
- A.Tableauで用意している素材があるし、各サイトの分析担当者が勝手に取り組んでくれているので助かっている。また、TableauではVizコンペをやっている、社内でもやっているのでオススメ。
- Q.ファイル名、データ名など、可視化の際の鉄則は?
- A.ツールや、どこまで分析するかにもよるが、命名ルールは大切。あとGit管理も出来ればと。(※これもLookerで対応可能ですね)
データ可視化の研究って何をしているの?何の役に立つ?
- 登壇者:水野 加寿代氏(ヤフー株式会社 ソフトウェアエンジニア)
最後3人目の発表は水野氏より、前2つのセッションとは異なる切り口、「情報可視化の研究」と「情報可視化の国際会議(EuroVis)」の紹介。
水野氏は「情報可視化はデータ分析ライフサイクルにおけるモデリングや評価といったフェーズの前後で必要となる技術です」とデータ分析における情報可視化の位置付けについて説明。そういったフェーズで「データ理解」「仮説検証/意思決定」「報告/内容理解」といった研究目的で可視化が用いられています。
また、セッション後半では水野氏が情報可視化の国際会議「EuroVis 2019」への参加・発表内容に関する紹介もなされました。
まとめ
というわけで、「Bonfire Data Analyst #2」参加レポートでした。個人的に印象的だったのは吉田さんセッションでの「目的と対象によってツールを使い分けている」という点。どうしてもプロジェクトでのツール選定では「こっちのツールの方が優れている、出来るのであっちのツールでは無くこっちを選ぼう」となりがちですが、全ての条件や要望を満たす万能ツールやサービスはそうそう無いものです。ユーザー層・レベル・ユースケースはプロジェクト運営を推し進めていく上で多種多様にならざるを得なくなりますので、この形はとても理に適っているなと思いました。