Lookerベスト・プラクティス:データを効果的に可視化する方法 #looker
Lookerではトピック毎のベストプラクティスを個別にドキュメントやナレッジベースとしてまとめています。当エントリではその中から、『データを効果的に可視化する方法』についてご紹介したいと思います。
目次
はじめに
このエントリでは、表示される情報の種類に基づき、ユーザーが最も理解しやすい『可視化(Visualizations)の種類』を選択する方法について説明します。
可視化(Visualizations)は、データから見つかった洞察(insights)を伝える効果的な手段・方法です。適切な可視化(Visualizations)を選択することは、組織全体で情報を効果的に共有する上で重要です。考慮すべき幾つかの"包括的なポイント"を以下に示します。
- 可視化(Visualizations)を表示しているエンドユーザーが、どのようにそれらを解釈し、アクションを実行するかを考えます。虚栄の指標(Vanity metrics: あまり意味のない指標)よりも、実用的なメトリックに注目してください。
- 可能な限りシンプルな可視化(Visualizations)を使い、メッセージを伝えましょう。過度に複雑な可視化は、すぐに理解することが難しく、誤解を招きやすいです。
- 軸と数値(measure)に、明確にラベルを付与しましょう。
- 統一性の取れた色(配色)を使いましょう。組み込みのカラーパレットを使うか、カスタムカラーパレットを使って一貫した色表示の方法を用います。
以降の項で、一般的な可視化(Visualizations)の種類と、各カテゴリで考慮すべき幾つかの『ベスト・プラクティス』を解説します。Lookerで使用出来る可視化オプションの完全なリストについては以下のドキュメントをご参照ください。
棒グラフ(縦棒グラフ・横棒グラフ)
縦棒グラフ(Column Charts)と横棒グラフ(Bar Charts)は、2つ以上の具体的な"カテゴリ値"を比較するのに効果的です。縦棒グラフや横棒グラフを使用することで、ユーザーは長さを素早く比較し、表示されるカテゴリ間の関係を把握出来ます。縦棒グラフと横棒グラフは名前の通り、「向き」が異なります。横棒グラフは水平方向、縦棒グラフは垂直方向です。
- ディメンションの軸ラベルが長い場合、縦棒グラフ(Column Charts)よりも横棒グラフ(Bar Charts)を選択することを検討してください。
- 負の値を表示する場合、縦棒グラフ(Column Charts)よりも横棒グラフ(Bar Charts)を選択することを検討してください。
- 時間の経過と共に値を比較する場合、常に縦棒グラフ(Column Charts)を選択してください。
- 可能であれば、常に水平ラベルを使用して情報を読み易くします。
- ユーザーからの誤解を招くことを避けるため、メジャー軸の数値は通常ゼロから開始する必要があります。
- ただし、データポイント間の非常に小さな違いや変更など、表示される洞察が完全に失われる状況ではこの限りではありません。
折れ線グラフ・面グラフ
折れ線グラフ(Line Charts)と面グラフ(Area Charts)は、時間などの連続データを表示するのに最適です。個別のデータポイントがプロットされますが、それらのポイントは繋げられ、ポイント間の連続性を表現します。そして、折れ線グラフと面グラフは、双方共に「傾向分析」が行い易いのが特徴です。
これら2つのグラフは似ていますが、同じ意味で使用しないでください。折れ線グラフは、グループ間でのパフォーマンスを比較したり、複数のメジャーを表示したりするのに最適です。一方面グラフは、「部分的」なところと「全体」との関係を累積的に表示するのに適しています。
- 折れ線グラフを積み重ねる時は注意してください。これは、折れ線の値が累積的であることを示す認知的な手掛かりが無いため、誤解され易いです。
- 個々のグループを比較するために面グラフを使用する際は、前の色の重なりによって後ろの色がすぐに不明瞭になるため、注意が必要です。
データを誤解されないように、y軸をゼロの値から開始するのが最善です。特定のトレンドにフォーカスする必要がある場合は、両方のバージョンをダッシュボードに常に配置し、ユーザーが全体像を把握出来るようにしておきます。
積み上げ棒グラフ・積み上げ面グラフ
積み上げ棒グラフや積み上げ面グラフなどの「積み上げ」グラフを使うと、連続する各シリーズが最後のシリーズの上に描画されるため、可視化(visualizations)に"複雑さ"を追加出来ます。ただし、これらは適切に実装されていないと読みにくい場合があるので注意です。
- 積み上げグラフを使って、「平均」などの『累積してはならない測定値』を可視化することは避けてください。
- 一度に多くの行またはカテゴリをプロットしないでください。5つ以下が理想的です。
- 参考:
二重軸チャート
二重軸チャートを使って、2つの異なるメジャー間の関係を可視化出来ます。このグラフは、対象となる測定値の間に存在する傾向または相関関係を示すのに役立ちます。そうで無い場合、それらの測定値が別々にプロットされた場合にはあまり意味を為しません。
このグラフは、合計値とパーセンテージなど、非常に異なる数値スケールでメジャーを組み合わせるときに良く用いられます。
- 様々な可視化の種類を組み合わせて、各メジャーを明確に説明出来ないか、検討してください。
- 各メジャーに対照的な色を使用して、それらを更に区別します。
主な測定値をどこに置くかを決める際に、ユーザーの言語コンテキストを考慮すると上手く行く場合があります。例えば、左から右に読むことに慣れている人は、最初に「左」に目を向ける傾向があるため、左側のy軸で主な測定値を見つけると便利です。(逆も同様)
円グラフ・ドーナツグラフ
円グラフとドーナツグラフを使って、値またはメジャーがカテゴリ間でどのように分割されるかを示すことが出来ます。
これらのグラフのセグメントは常に合計で100%になる必要があるため、ユーザーは各カテゴリに帰属出来る円の割合を把握出来ます。これらのタイプのグラフはデータの一般的な構成を示すのに適していますが、個々のセクションを相互に比較したり、正確な値を表すのには使わないでください。
- 可能な限り、円グラフまたはドーナツグラフに含めるカテゴリを5つ未満にしてください。
- 可能な場合、棒グラフのような可視化を選択してください。棒グラフには、y軸に積み上げられたパーセンテージとしてシリーズを表すための「積み上げパーセンテージプロットオプション」があり、全ての値が100%になるように表現出来ます。
まとめ
というわけで、Lookerにおける『データを効果的に可視化する方法』のご紹介でした。
Lookerでも用途に応じて様々な『可視化』タイプでデータを表現出来ます。様々なオプション、設定でデータを分かりやすく表現出来るのが可視化ツール・サービスの醍醐味ですので、Lookerでもこのテーマについては色々使い倒して『どこまで表示・表現出来るのか』について調べてみたいと思います!