【アンケートデータ可視化】データ可視化をやってみた~Power BI編~
はじめに
データアナリティクス事業本部 BIチームのkariyaです。
BIチームでは、アンケートデータの可視化をテーマにブログリレーを行っています。
当記事では、Power BIを用いてアンケートデータの可視化を行います。
Power BIとは
Microsoftが提供している、Windowsで使用できるセルフBIツールです。デスクトップアプリのPower BI Desktopは無料で利用することができます。 Share Point Online等とのデータの連携が容易なため、Microsoft 365を使用している組織などでは特に便利なツールです。
Power BIの操作画面について簡単に説明します。赤枠部分の左から順に、フィルターペイン、視覚化ペイン、データペインがあります。
具体的な操作についてはこの後に記載していきますが、おおまかに以下の違いがあります。
- フィルターペイン:データの絞り込みに使用する
- 視覚化ペイン:グラフの種類、表示するデータ列、書式など設定に使用する
- データペイン:取り込んだデータの列を表示。フィルターペインや視覚化ペインに使用する列をここから選択する
使用するデータ
東京都の丸の内仲通りで、自動運転バス走行実証実験が実施されています。 実証実験の詳細に関してはこちらをご覧ください。
実証実験の結果がオープンデータとして公開されていますので、今回はその中から以下のデータを使用します。
データ可視化の流れ
今回の可視化は以下のステップで実施します。
- データ取込
- 回答者の属性を可視化する
- 単一回答を可視化する
- 複数回答を可視化する
- 自由回答(フリー入力)を可視化する
1.データ取込
今回はPower BIで使用できるETL機能のPower Queryでデータを取込み、加工したものがありますので、こちらを使用します。
取込んだデータは、データビューで確認することができます。
2.回答者の属性を可視化する
回答者数を性別、年齢、職業などの各属性に合わせて、下記のように色々なビジュアルで可視化したページを作成します。
ページ全体の書式設定
ビジュアル(グラフ)が無い状態や、ビジュアルを何も選択していない状態で、視覚化ペインを選択するとページ全体の書式設定ができます。
今回はキャンバスの背景色を薄い灰色にしています。ビジュアルの背景は白で作成されるため、背景色を入れることでビジュアルを目立たせることができます。
テキストボックス
次にページのタイトルを作成します。挿入 > テキストボックスを選択します。
作成されたテキストボックスをクリックし、回答者属性と入力します。 テキストボックスの外枠部分をドラッグアンドドロップするとテキストボックス自体のサイズ変更ができ、テキストボックスの近くに表示されるウィンドウでフォントの変更や太字などの設定が可能です。
今回はサイズ18、太字に設定してみます。
タイトルを目立たせたいので、背景色を変更します。 書式ペイン > 効果 > 背景 > 色にて、水色を選択します。
フォントの黒色が目立たなくなってしまったため、フォントの色を白に変更します。 フォントと背景の書式設定をする箇所が別々になっているところは要注意です。
背景色の設定とタイトルを作成しました。
それではデータを用いた可視化をしていきます。
カード
ビジュアルのビルドから、カードを選択します。
中身が空のビジュアルが作成されました。
データペインから、視覚化ペインのデータに回答者IDをドラッグ&ドロップで入れます。回答者IDの左側にあるチェックボックスをクリックして入れることも可能です。
1レコード分の回答者IDの内容が表示されました、回答者数を出したいので、一意のカウントをするように変更します。
回答者数が表示できました。
数字は正しいのですが、回答者IDのカウントという表記は見る人にとって何の数字か分かりにくいので、回答者数に変更します。 データ > 回答者IDのカウント をダブルクリックすると、表示内容を変更できます。
表示内容が変更できました。
ドーナツグラフ
試乗体験者と歩行者の割合を可視化します。ビジュアルのタイプでドーナツグラフを選び、下記のように設定します。
- 凡例:回答者フラグ
- 値:回答者ID
円グラフ
性別構成比を可視化します。
- 凡例:性別
- 値:回答者ID
100%積み上げ横棒グラフ
年代別構成比を可視化します。
- X軸:回答者ID
- 凡例:年齢
ドーナツグラフや円グラフとは設定内容が異なっています。ビジュアルにより設定項目が変わりますので注意しましょう。
ツリーマップ
職業別構成比を可視化します。
- カテゴリ:職業
- 値:回答者ID
補足:ビジュアルの書式設定
ここで、ドーナツグラフと円グラフでは、歩行者/試乗体験者と男性/女性の色が同じになっています。
異なる意味が同じ色になっていて誤解を招く場合は、グラフの色を変えておきましょう。
グラフの色やタイトルなど、見た目に関連する設定はビジュアルの書式設定で行います。 様々なメニューがあり、アップデートでメニューが変わることがあるため、設定したい内容で検索をするのがおすすめです。
例えば、色で検索すると、テキストの色やグラフの色など、色に関するあらゆる設定が表示されます。
グラフの色を変えることも簡単ですね。
なお、ツールヒント(グラフにカーソルを合わせると表示される情報)については、書式設定では設定ができません。
ツールヒントは、ビジュアルのビルドにて設定を行います。項目を追加することはできますが、デフォルトの表示から内容を減らすことはできませんでした。今後実現方法が分かった場合は追記します。
3.単一回答を可視化する
次はアンケートの回答を可視化していきます。まずは質問に対して単一の回答を行なっている場合の可視化です。
特定の質問のみ可視化するため、フィルターペインで絞り込みを行います。
あとは回答者属性と同様に可視化していきます。まずは2択の回答を円グラフにします。
- 凡例:回答
- 値:回答者ID
続いて、利用頻度についての質問を100%積み上げ横棒グラフにします。
- X軸:回答者ID
- 凡例:回答
可視化はできましたが、利用頻度の順番になっていないため分かりにくいです。 Power BIでは凡例の順番をドラッグ&ドロップのような方法で自由に並び替えることはできませんので、利用頻度順に並び替える列をPower Queryで作成します。
ホーム > データの変換から、Power Queryエディターを開きます。
列の追加 > 条件列を選択します。
回答内容に応じて、1.
などの番号を付与した列を作成します。
Power Queryを閉じてPower BIの画面に戻り、凡例の設定を新規追加した列に変更します。
利用頻度順に並び替えることができました。
凡例の位置は、視覚化ペイン > 凡例から変更ができます。今回は右寄せ中央揃えにしてみます。
凡例の位置を変更できました。
続いて、利用頻度を表形式で可視化します。 同じデータを使用したグラフを作成する場合は、既存のグラフを選択してctrl + cでコピー、ctrl + vで貼り付けができます。
今回は、コピーしたビジュアルのビジュアルタイプをマトリックスに変更してみます。
テーブルやマトリックスなど、表形式のビジュアルについては、並び替えがワンクリックで可能です。
マトリックスの場合は、データバーを表示することで表と横棒グラフを同時に見せることも可能です。
列の端のあたりをドラッグすると、列の横幅を変更できます。
横幅の調整をし、単一回答のページができました。
4.複数回答を可視化する
1人が1つの質問の中で2個以上の回答を選択できる質問について、積み上げ縦棒グラフとテーブルで可視化してみます。
同じデータで複数のグラフを作成する場合、あらかじめページ単位でフィルタをかけておくと便利です。
積み上げ縦棒グラフを作成します。
- X軸:回答
- Y軸:回答者ID
ビジュアルをコピーして、今度はテーブルを選択します。
先ほどはマトリックスでデータバーを表示しましたが、テーブルでもデータバーの表示が可能です。 回答者IDのカウントを右クリック > 条件付き書式 > データバーをクリックします。
こちらでは、表示する最大値などの詳細設定ができます。今回は最大値を300にしています。
データバーを設定することができました。
ページ全体はこのようになりました。
5.自由回答(フリー入力)を可視化する
続いて、自由に入力できる質問を可視化します。
テーブル
回答そのものをテーブルで可視化します。
- 列:回答
その他のビジュアル
回答を検索するためのビジュアルを追加してみます。
Power BIでは、もともと用意された以外のビジュアルも追加することができます。 視覚化ペイン > 3点リーダー > その他のビジュアルを選択します。
以下でフィルター > フィルターを選択し、Text Filterをクリックします。
Text Filterの詳細が表示され、追加するをクリックすると今使っているPower BIにビジュアルを追加することができます。 なお、利用する際はライセンス契約について事前に確認しておきましょう。
視覚化ペインに、Text Filterのアイコンが追加されました。以下のように設定することで、閲覧者がテキストで検索することができます。
- Field:回答
続いて、ワードクラウドも作成してみましょう。Text Filterと同じように、視覚化ペイン > 3点リーダー > その他のビジュアルを選択後、Word Cloudをクリックします。右上に検索ボックスがありますので、wordやcloudなどで検索すると探しやすいです。
ビジュアルを追加すると視覚化ペインでアイコンが選択できますので、設定を行います。
- カテゴリ:回答
こちらは回答をそのまま表示しているだけなので、ワードクラウドとして使用するにはデータを形態素解析しておくなど事前の加工が必要です。
補足:ビジュアル間の相互作用
テキストフィルターで安全と検索してみると、テーブルとワードクラウドの両方で安全を含むデータに絞り込まれます。
このように、関連するデータを使用しているビジュアルは自動でデータの絞り込みやハイライトがかかります。
おわりに
アンケートデータをPower BIにより可視化してみました。 今回のブログリレーでは、他のBIツールでも可視化を行っていますので、よろしければ以下の記事もお楽しみください。
最後までお読み頂きありがとうございました。
データ可視化する際のヒントに少しでもなれば嬉しいです。