Exploratoryでの可視化実践:ピボットテーブル編 #exploratory

2021.01.31

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

昨年から使い始めている分析ツール『Exploratory』。分析に関する幾つかの機能の中には「データの可視化を行う機能」も用意・提供されています。

データの可視化機能はあるのですが、これまで私自身が使ってきた可視化ツールと操作・設定方法がどのように異なっているのか、また同じなのかがまだ分かっていません。なので、Exploratoryで利用出来る可視化機能を使いこなすために『どういう設定・指定方法でどういう可視化が出来るのか』を試してみた内容を備忘録として残していこうと思います。当エントリで紹介する内容は『ピボットテーブル』です。

目次

 

可視化に用いるデータ

当エントリで用いるデータは、Exploratoryで用意・提供されているものを使ってみたいと思います。

プロジェクト作成後、データフレームの追加ボタンから『データ・カタログ』を選択。

ここでは『Titanic Data』を付かてみたいと思います。「インポート」を選択。

「保存」からデータフレーム名を入力し「保存」を選択。

このデータを後続手順で利用します。[チャート]タブを選択して次に進みます。

 

可視化実践内容

ここからは実際に可視化部分の作成を行っていきます。タイプで「ピボットテーブル」を選択し、任意の行を選択。複数選択を行っていくと、その順番で項目が入れ子の形で配置されていきます。

値の情報に関しては、初期段階では「行の数」が指定されているようです。イコール「データ件数」となるわけですね。

配置した項目情報は項目右側のメニューを掴んでドラッグアンドドロップすることで順序を変更出来ます。

値の情報については、任意の数値項目を選択後は以下のような形で任意の計算方法を踏まえて表示の切り替えが可能です。

列項目については数値項目を指定した場合、ツール側で値の初期表示を行っているようです。今回試した感じでは「カテゴリー」という形で表示が為されていました。年齢(age)を選択していたので「年代」的な括りにしたいなーと思い、ちょうど「10ごと」という指定が可能でしたので選んでみると、以下の様に年代毎の表示に切り替えることが出来ました。

列に文字列情報を選択した場合は、値をカテゴリ毎に分割して表示します。

「合計」に関しては表の列や行毎の合計情報を別途追加で表示させることが可能です。

セルの値情報を踏まえた「ヒートマップ」的な表示を行うことも可能です。色味や色判定を行う範囲、その他詳細な指定が行えます。

表全体の見た目に関する指定は「タイプ」脇にある設定メニューから切り替えを行う事が可能です。

 

まとめ

というわけで、Exploratoryの可視化実践「ピボットテーブル」に関する実践内容の紹介でした。

Exploratoryではこの他にも様々なデータの可視化方法が提供されていますので、引き続き様々なデータを使ってその内容を紹介していきたいと思います。