利用可能な表示形式一覧 #quicksight #01 | Amazon QuickSight Advent Calendar 2016
当エントリは『Amazon QuickSight Advent Calendar 2016』の01本目のエントリです。
現在開催されている『AWS re:Invent 2016』の直前に一般利用可能となったAWSによるBIサービス、Amazon QuickSight。発表されたばかりですが、早速Amazon QuickSightを使い倒すべく色々な切り口でその内容について見て行きたいと思います。
01本目となる当エントリではまず、Amazon QuickSightでどのようなビジュアル(表示形式)が使えるのかについてさらっとご紹介致します。
Amazon QuickSightではデータの可視化を行うための仕組みとして『ビジュアル』という機能があり、様々な表示形式が提供されています。
ビジュアルにおける『メジャー』と『ディメンション』
メジャー
様々なビジュアルの表示形式を説明する際、ビジュアルにおける測定、比較、集計に使う"数値"を参照する為に『メジャー』という用語を用います。
QuickSightでは、『メジャー』は以下のいずれかのものを指します。いわゆる『数値項目』というやつですね。
- 『製品コスト』のような"数値フィールド"
- 『トランザクションIDの件数』の様な、任意のデータ型のフィールドの"集計数値"
ディメンション
いっぽう『ディメンション』はテキストフィールドまたは日付フィールドを参照する為の項目となります。
- 『商品』の様な項目名称
- メジャーに関連する属性である可能性のあるテキストフィールドまたは日付フィールド
というような項目を参照する際に使用されたり、
- 『売上高の売上日』
- 『顧客満足度の製品メーカー』
といった、上記要素を分割する為に利用する事が出来ます。『切り口』というフレーズだとイメージが付きやすいでしょうか。
Amazon QuickSightにおける『メジャー』と『ディメンション』の振り分け
Amazon QuickSightはデータ型に基づいてフィールドをメジャー・ディメンションのいずれかに自動的に識別します。
ディメンションとして機能する数値フィールド(例:郵便番号やID番号等)がある事に注意してください。そのような項目の場合、『データ準備』の段階でフィールドの内部に文字列データを含めておくと良いでしょう。そうしておく事でQuickSightはそのフィールドをディメンションとして扱うようになり、数値計算を行わなくなります。
この部分については、分析毎にフィールドを『ディメンション』または『メジャー』のどちらで表示するかを変更する事が可能です。 詳細については下記をご参照ください。
ビジュアルにおける表示制限について
全ての表示形式では、表示されるデータポイントの数が制限される為、ビジュアルの要素(線や棒、バブルなど)が表示・分析しやすくなります。ビジュアルは、選択した表示形式で定められている上限までの最初のN個の行を選択し、ソート順序が指定されている場合はその順序に従って、そうでない場合はデフォルトの順序で並び替えて表示されます。
サポートされているデータポイントの数は表示形式に拠って異なります。詳細については任意の表示形式の各トピックをご参照ください。 ビジュアルのタイトルでは、表示形式の制限に達した場合に表示されるデータポイントの数を示します。 大量のデータセットがあって、表示制限に抵触する事を避けたい場合は、1つ以上のフィルターを使用して表示されるデータ量を減らす事で対応可能です。ビジュアルにおけるフィルタに関する詳細については以下をご参照ください。
Amazon QuickSightで利用可能な『表示形式』の一覧
そしてここからは、現時点でAmazon QuickSightで利用可能な『表示形式』の一覧をざっくりとご紹介していきたいと思います。表示形式それぞれの詳細については内容も盛り沢山となっているため、今後のカレンダーで適宜紹介して行くつもりです。
AutoGraph
AutoGraphは表示形式ではありませんが、代わりにAmazon QuickSightが表示形式を選択してくれます。『オススメ』『おまかせ』機能みたいな感じでしょうか。
AutoGraphを選択した上でフィールドを選択してビジュアル作成を行うと、Amazon QuickSightの方で自動的に最も適した表示形式を選んでビジュアルを作成してくれます。
Horizonal bar chart(水平棒グラフ)
水平棒グラフ。単一、複数のメジャー、クラスタ化された棒グラフを作成出来ます。
Vertical bar chart(垂直棒グラフ)
垂直棒グラフ。単一、複数のメジャー、クラスタ化された棒グラフを作成出来ます。
Horizonal stacked bar chart(水平積み上げ棒グラフ)
水平積み上げ棒グラフ。値を階層として分割表示します。
グラフの長さは、選択したメジャーの最大値に基づくスケールを使用します。
Vertical stacked bar chart(垂直積み上げ棒グラフ)
垂直積み上げ棒グラフ。値を階層として分割表示します。
グラフの長さは、選択したメジャーの最大値に基づくスケールを使用します。
Horizonal stacked 100% bar chart(水平積み上げ100%棒グラフ)
水平積み上げ100%棒グラフ。
Horizonal stacked bar chart(水平積み上げ棒グラフ)が長さに選択したメジャーの最大値を使用するのに対し、こちらのグラフは100%の縮尺率を使って値を表現します。
Vertical stacked 100% bar chart(垂直積み上げ100%棒グラフ)
垂直積み上げ100%棒グラフ。
Vertical stacked bar chart(垂直積み上げ棒グラフ)が長さに選択したメジャーの最大値を使用するのに対し、こちらのグラフは100%の縮尺率を使って値を表現します。
Line chart(ラインチャート・折れ線グラフ)
折れ線グラフ。一定期間における1つ以上のメジャーまたはディメンションの値の変化を比較する時に使います。
Area line chart(エリアチャート・エリアラインチャート)
エリアラインチャート。折れ線グラフが各値を線で表示するのに対し、色の範囲で値を表示する部分が異なります。
Pivot table(ピボットテーブル・クロス集計表)
ピボットテーブル・クロス集計表。2つのディメンションが交差する部分のメジャーの値を表形式で表示します。
Scatter plot(散布図)
散布図。ディメンションにおける2つまたは3つのメジャーを視覚化します。
X軸とY軸を用いて2つの異なるメジャーを表し、ディメンション内の2つのメジャー項目の値が交差する点の部分をバブル・点で表示します。
Tree map(ツリーマップ)
ツリーマップ。ディメンションの1つまたは2つのメジャーを視覚化します。
ディメンション内の1つの項目を四角形で表示し、項目のサイズは全体と比較した、個別の項目のメジャーの値の割合を表します。
Pie chart(パイチャート・円グラフ)
パイチャート・円グラフ。ディメンション内の項目の値を円の中の楔(くさび)の大きさで比較します。
精度が重要では無く、ディメンションに項目が殆どない場合に最適です。
Heat map(ヒートマップ)
ヒートマップ。2つのディメンションの交差の尺度を表示し、値の大小を色で表現します。
まとめ
という訳で『Amazon QuickSight Advent Calendar 2016』01本目、サービスで使える表示形式の一覧に関するご紹介でした。明日もお楽しみに!