【アンケートデータ可視化】ダッシュボード構築時の思考ステップ
こんにちは!データアナリィクス事業本部の武田です。
BIチームでは、アンケートデータの可視化をテーマにブログリレーを行っています。
今日は、「アンケートデータでダッシュボードを作って」と言われたときに、私が考えていることを解説します。 今回の記事ではTableauで作成していますが、Tableauでの作り方の解説はしませんので、あしからずご了承ください。
前提
既にアンケートを実施されていて、アンケートデータが集まってきたので、ダッシュボードにして欲しいという依頼があったと想定します。
データ説明
対象データは大手町・丸の内・有楽町(OMY)データライブラリのオープンデータの中から、アンケートデータを使用します。
【2020年度】丸の内仲通りにおける自動運転バス実証実験のアンケート結果(試乗体験者)
【2020年度】丸の内仲通りにおける自動運転バス実証実験のアンケート結果(歩行者)
上記データを下記のように加工してから取り込んでいます。加工については、ブログリレー企画のデータ加工編でご確認ください。
この実証実験の事業概要は、大丸有スマートシティプロジェクト リ・デザイン実証事業概要に纏まっています。
アンケート内容の確認
アンケート質問項目が「歩行者」と「試乗者」で異なっていたため、質問項目を整理してみました。
作ったダッシュボード
今回の思考ステップで作ったダッシュボード
左半分が試乗者のデータ、右半分が歩行者のデータで統一し、見比べられるようにしました。 「今回実験した自動運転は、今後継続するのかしないのか、継続する場合に障害となること(解決しなければならないこと)はないか?」 という問いを立てて、それに答えるようなデータ項目を優先的に選んで、1枚にまとめました。
この1枚を見ながら、「継続しよう or 継続はやめよう」をデータをもとに議論できるようにすることが、私の狙いです。
ちなみに、Tableauのフィルタアクションを設定しているので、「ある年代の人だけ」「女性だけ」「利用すると答えた人だけ」といったフィルタをして表示するということができます。
何も考えずに作ったダッシュボード
比較対象として、もう1パターンダッシュボードを作ってみました。アンケート質問を上から順番に1問ずつ集計したけだけダッシュボードです。(スペースの関係上、歩行者のデータだけですが、試乗者のアンケート結果も同じようにアンケート質問の順番で並んでいると思ってください。)
上のダッシュボードと下のダッシュボードを見比べて見てください。
どちらが議論しやすいですか?
どちらが考え込まずに自分の考えをまとめられそうですか?
最重要ポイント:ただの集計にしない。目的意識を忘れない。
「課題を見つけられるダッシュボードを作ってほしい、アクションにつながるダッシュボードが欲しい」とよく言われますし、私たちはそれを目指して仕事しています。
では、何をどうしたらいいのか?私の答えは、「目的」「ゴール」を常に意識し続けていくことだと考えています。
今回のアンケートデータの場合、アンケートを行う前に、アンケートをとる目的が設定されていて、どんなアンケートを取るのかという設計もされているはずです。(無目的にお金と時間をかけてアンケートをとるということはしないはずという前提に立っています。)
この「アンケートをしたそもそもの目的」を、最初から最後まで絶対に忘れないことが、キーを握っていると思います。
ダッシュボード開発工程の解説
では、上のダッシュボードをどのようにして開発したのか、その工程で考えたことを解説します。
ステップ1:ゴールを確認する
ダッシュボードを作り始める前に、「ゴール」を確認します。
今回のアンケートデータの場合は、オーブンデータのため事前説明はありませんでしたので、私の中で仮のゴールを設定しました。
仮のゴールは、「今回実験した自動運転は、今後継続するのかしないのか、継続する場合に障害となること(解決しなければならないこと)はないかを明確にすること」です。障害となることが明確になっていれば、手を打つべき課題がわかっているので、アクションにつながりやすくなります。
ステップ2:ゴールのために「何を見たいのか」を整理する
「ゴール」を明確にしたら、次は「何を見たいのか」を考え、見る視点を整理します。
「自動運転は、今後継続するのかしないのか、継続する場合は何を解決しなければならないかを明確にする」ためには、 どんな視点でどんなデータを見たら、その問いに答えられるのかを、下記の5つの視点で考えました。
- 1.何がどうなったらいいのか、何と比べるか?を考える。
- 2.要素になる項目を分解して、いろんな切り口を洗い出す。
- 3.インパクトが大きい(影響力が大きい)要素は何かを考える。
- 4.データの有無(入手できるかどうか)を確認する。
- 5.法則性(時系列での変化、要素同士での相関や因果などの関係性)はありそうかを確認する。
上記の視点で考えて、「もし自分が意思決定する立場だったら、この情報で決められる?周囲に説明できる?」と自問自答して、見直します。
1.何がどうなったらいいのか、何を比べるか?を考える。
「今回実験した自動運転は、今後継続するのかしないのか」を判断するとして、何がどうなっていたら「継続する」と判断できるかを考えます。
今回のアンケートでは、私は下記3つの軸を考えました。
・安全性:試乗者も見ている歩行者も、安全が保たれたか。 ・満足度:試乗者は今後も乗りたいと思ってくれているか、見ている歩行者に乗ってみたいと思われているか ・収益性:事業として継続できるような収益が見込めるか
もし、この実証実験バスが収益性を求めないもの(地域活性化を目的とするもの)である場合は、収益性の軸の代わりに、「活性度」を置いて、乗降者数や人の行き来がどれだけ増えたかといった点を確認することになるだろうと考えました。
この時点ではデータの有無は考えず、「目的」に対してストレートに答えることを意識して、軸に漏れがないかを考えます。データありきではなくて、視野を一旦広げて、目的に対してストレートに答えるには何があれば答えられるのかという点で考えます。
また、それぞれデータがあったとしても、そのデータの数字だけでは良いのかどうかの判断はできません。何かと比べて判断することになります。
例えば、通常の売上や利益といったデータであれば、予算、目標、前年等と比べますね。
今回のアンケートデータの場合、もしアンケートを行う前に「満足と答えた人が何割以上を目標とする」と決まっていれば、その目標値と比べます。 事前に決まっていなければ判断できないので、別の似ているアンケートで参考になるものがあれば、その結果と比較するということも検討します。
アンケートデータのみで目標値がない状態なので、依頼者と打ち合わせできる場があれば、「目標値はありませんか?参考にできるベンチマークデータはありませんか?」とリクエストしたいところです。
今回は、仮に50%の人が「利用したい」と答えることを目標にしたとして、目標値を赤いラインで表示することにしました。
(注)大丸有スマートシティプロジェクト リ・デザイン実証事業概要資料によると、「満足度50%以上を目標」と記載がありました。このKPIは2022年度の目標値で、今回のデータは2021年3月実施分と時期がずれているのですが、参考値として利用しました。
アンケートデータしかないのをわかっているのに、一旦データの有無に関わらず軸を考えるというのは、無駄に思えるかもしれません。しかし、軸や要素を洗い出しておくことで、思わぬ大事な視点が抜けていることに気がついたり、今後データを取得した方が良いという議論をしたりすることができます。
2.要素になる項目を分解して、いろんな切り口を洗い出す。
先ほどあげた軸に対して、考えられる要素を具体的に考えていきます。
下記のような感じで細かく分けていきました。
・安全性→スピード、ブレーキ、故障率、事故率 ・満足度→「利用したい」という人がどれだけいるか、不安を感じてないか、不満ポイントはどこか ・収益性→単価、人数、初期費用、運営費用
この時点でも、まだデータありきではありません。データの有無は別のステップで考えるので、データの有無は関係なしに、要素を分解しています。
3.インパクトが大きい(影響力が大きい)要素は何かを考える。
今回の実証実験の「自動運転を継続するかどうか」という視点で、最もインパクトが大きいのはどういう要素なのかを考えてみます。
最もインパクトが大きいのは、「法規制を守っていて、安全であるか」だろうと考えました。安全でなければ、そもそもこの自動運転そのものが成立しないからです。
もし、法規制を守っていて、安全だという前提であれば、「利用したい」と答えた人の割合が最もインパクトが大きそうだと思いました。
「利用しない」と答えた人がいた場合、なぜ利用しないのかの理由がわかれば、「継続する場合に障害となること(解決しなければならないこと)」として対策をとることができると思いました。
その上で、収益性を確認するという流れを考えました。
4.データの有無(入手できるかどうか)を確認する。
上記で、安全を真っ先に考えたいところですが、今回の場合、時速どれくらいで走ったのか、事故は起きなかったのか、この車両の故障率等、安全性のデータはありません。本来はデータがあると思いますが、今回は可視化の対象外としました。
今回のアンケートデータでメインで可視化することができるのは、「満足度」に関わる部分です。「利用したい」と答えた人の割合と、「利用しない」と答えた人がいた場合、なぜ利用しないのかの理由を、可視化したい重要ポイントだと考えました。
また、収益の面は、初期費用や運営費用等のデータもありませんので、今回は可視化の対象外としています。これも、本来はデータがあると思います。(アンケートの中に、「適正価格はいくらかだと思うか」という項目がありましたので、そこが一部該当します。)
5.法則性(時系列での変化、要素同士での相関や因果などの関係性)はありそうか
継続的なアンケートではないので、時系列での変化は見ることができません。
要素同士の関係性は、たとえば、性別・年代によって、自動運転に対して「乗りたい」・「やっぱり不安」と考える人に傾向があるかもしれないなと思いました。(車が好きな人や新しい技術が好きな人は、乗ってみたいと思う傾向があるのではないかと思いました。)
ですので、「どんな人に(属性別に)どういう傾向があるのか」という点で見比べられるようにしたいと考えました。
実際、性別で見比べてみたら、歩行者と試乗者で割合が大きく違います。普段の通行者の性別構成比がわからないので、これだけで結論は出せませんが、「自動運転に乗ってみたい」と思う人の割合は男女で違いがあるかもしれないなと思います。
ステップ3:データの事前チェックをする
データ加工に関わってくるところになるのですが、下記のような内容を確認します。
データ加工が必要であれば、このステップでデータ加工をしておきます。
アンケートデータでよくある内容は、下記にまとめています。
ステップ4:「見たいもの」を見せるのにどう見せるとわかりやすいかを考える
やっと、グラフの見せ方のステップです。
時系列であれば棒グラフか折れ線グラフ、 構成比であればツリーマップや円グラフ、 といった感じで、見せたいものによってある程度のバリエーションが決まっています。
この分野は、これだけで本になっていたり、Tipsもネット上にまとまっていたりしますので、目を通しておくと良いと思います。
私自身、そんなにTipsのレパートリーがあるわけではないですが、Tableauであればネット上で世界の凄腕の方のダッシュボードが見れますし、市販本を読んで、「見せたいものが伝わるグラフになっているのか」という視点で考えるようにしています。
ステップ5:データ連携の自動化や本番運用の工程を検討する。
この工程は継続的にアンケートをとり続けて、それをシステム化(自動化)したい場合に考えます。 今回の場合は1回限りですのでスキップしています。
システム化する場合は、どこから、どんなデータを、どのように加工して、どこにどれくらいの頻度で保管するのか等、詳細を決めて開発していくことになります。
振り返り
「アンケートデータを渡されただけなのに、ここまで考えるものなの?」とも思われたかもしれません。
特に、ステップ1−2の工程は意識していなければスキップされがちです。しかし、ステップ1ー2の工程がないと、「せっかく作ったのに使われない」となってしまうことが多いので、そこにかなりの時間とパワーをかけています。
いきなりステップ4からやる方が多いのですが、そうすると大体「質問の上から順に集計しただけダッシュボード」になってしまいます。けれど、ステップ1から始めると、「このダッシュボードを使ってやりたいことは何なのか?」と向かい合うことになり、出来上がるものが変わってきます。
データ分析をするとき、「仮説を出せ」「仮説が大事」と言われますが、誰でもすぐに仮説が出てくるわけではないですし、学校でそんな授業もありません。最初からできる人なんていないと思っています。
どうやったらできるようになるかというと、ステップ1からスタートして、「ゴールのために何をみたいかを整理する」という工程に向かい合い、集中してどっぷり考え、試行錯誤する時間を繰り返すというトレーニングが必要じゃないかなと考えています。私自身もまだまだトレーニングしていきたいなと思っています。