Amazon QuickSight:【概要】Amazon QuickSightとは何か?
Amazon QuickSight、いよいよGA(一般利用可能)となった事で色々触ってみたい!と思っていらっしゃる方も多いかと思います。利用するにあたって『そもそもAmazon QuickSightって何が出来るんだろう?』という部分はまず始めに抑えておくべきかと思いますので、当エントリではその辺りについて内容をご紹介してみたいと思います。
目次
- Amazon QuickSight概要
- データ(Data)
- 分析(Analyses)
- ダッシュボード(Dashboards)
- 一般的なAmazon QuickSight可視化フロー (Typical Amazon QuickSight Workflow)
- まとめ
Amazon QuickSight概要
Amazon QuickSightは高速なクラウドBIサービスです。簡単に情報を可視化する事が出来、アドホック分析を実行して素早くデータから気付きを得ることが出来ます。Amazon QuickSightを使う事でシームレスにAWSのデータソースと連携し、組織内のユーザーに情報を展開する事が出来ます。Amazon QuickSightでは、今回のこのサービスの為に新しく作られた『SPICE』という仕組みを採用しています。このネーミングは
- Super-fast(超高速)
- Parallel(並列)
- In-memory Calculation Engine(インメモリ計算エンジン)
からなる言葉のそれぞれの頭文字から取っています。
Amazon QuickSightには以下の様な特徴があります。
- 素早く始められる:
- サインインし、データソースを選んで数分で可視化を作成出来ます。
- 複数のデータソースにアクセスできる:
- ファイルやAWSデータソース、外部のデータベースに対応。
- 最適化された可視化:
- 選択したデータに基づいて最適化された可視化を提供します。
- 素早く答えを得られる:
- 大きなデータセットに対しても素早くインタラクティブな可視化を生成します。
- データを通してストーリーを伝える:
- 可視化を通しての"気付き"を他のメンバーと共有出来ます。
Amaozn QuickSightではデータソースからデータセットを作成し、分析を作成してデータを可視化します。Amazon QuickSightのコンポーネントや処理プロセスについては以下に解説する手順を踏んで進めて行きます。
データ(Data)
Amazon QuickSightではAWSサービスを含め、オンプレデータベース、幾つかのファイルフォーマット等をデータソースとして扱う事が出来ます。現時点(2016年11月16日)での対象データソースは以下の通りです。
対応データソース
Amazon Redshiftクラスタ
データベースインスタンス
データベース環境で利用可能なタイプは以下のものとなります。
- MySQL(5.1以上)
- PostgreSQL(9.3.1以上)
- MariaDB(10.0以上)
- Aurora(Amazon RDSのみ)
- Microsoft SQL Server(2012以上)
Redshift及びAuroraインスタンスはAWS環境内に存在するものに限りますが、その他のデータベースについては以下の条件を満たすものであれば利用が可能です。
- RDS
- Amazon EC2環境導入下のDB
- ローカルネットワーク
- その他インターネットアクセス可能な環境下のDB
テキストファイル
ファイルについては、以下の内容のものを利用する事が出来ます。ファイルについては、gzip圧縮されているものであれば、未圧縮のものと同様に扱う事が出来ます。もし他の圧縮形式を使っていた場合は一旦解凍しておく必要があります。
- ローカルネットワーク上のEXCELファイル(*.xlsx)
- ローカルネットワーク上もしくはS3上の、区切り文字を使ったテキストファイル(CSV, TSV等)
- ローカルネットワーク上もしくはS3上の、ログファイル(*.clf) ※参照:Common Log Format - Wikipedia, the free encyclopedia
- ローカルネットワーク上もしくはS3上の、拡張ログファイル(*.elf) ※参照:Extended Log Format - Wikipedia, the free encyclopedia
SaaS(Software as a Service)のデータソース
Amazon QuickSightでは、Salesforceの以下エディションでのレポートやオブジェクトも利用する事が出来ます。(ただ、結合されたレポートについては現時点で対象外の様です)
- Enterprise Edition
- Unlimited Edition
- Developer Edition
データを活用する為には、まずデータセットを作成します。これは接続テーブル名のような、使いたいデータを指し示す情報となります。データセットは、処理を行った『データ準備』(Data Preparation)を格納します。このデータ準備は、フィールドのリネームやデータタイプの変更等を指します。これを用意しておくことで、分析の度にデータを再度準備しておく必要がなくなります。
データソースからデータセットを作った後は、以下の図の様に、分析を作成して行くことが出来ます。
1つの分析内に複数のデータセットをまとめる事も可能です。『データセット作成』に関する詳細は以下をご参照ください。
データの準備
データの準備(Data Preparation)は生データをAmazon QuickSightで扱えるようにクレンジングしたり、変換を行うプロセスです。この作業には、計算フィールドの追加やフィールド名・データ型の変更、日付範囲を絞り込む為のSQLを作成する事等を含みます。
データ準備の詳細に関しては以下をご参照ください。
SPICEエンジン
SPICEは高速に計算を実行し、データを提供する目的の為にゼロから設計されたものとなります。データをSPICEにインポートする事でストレージと処理能力を効率良く活用出来るようになり、分析クエリを高速化させる事が出来るようになります。また、ビジュアル(Visual)を変更・更新する際にデータをデータソースから再取得しなくて済むようになります。
Amazon QuickSightのアカウントでは、ユーザー毎にデフォルトで10GBのSPICE領域を持つ形になります。また無償利用枠として、ユーザー1人あたり1GBのSPICE容量が割り当てられています。SPICEの容量管理に関する詳細は以下をご参照ください。
分析(Analyses)
『分析(Analysis)』は、データのグラフィカル表現である『ビジュアル(Visual)』を作成し、対話するためのベースとなる単位となります。それぞれの分析には、販売分析、コスト分析、主要業績評価指標(KPI)といったような任意の目的でユーザーが集約した1つ以上のビジュアルが含まれています。それぞれの分析には、分析の異なるイテレーションを保存する事が出来る『ストーリー(Story)』も含まれています。
Amazon QuickSightの分析に関する詳細は以下をご参照ください。
ビジュアル(Visuals)
『ビジュアル(Visual)』は、利用可能なビジュアルの型を使った、データセットのグラフィカルな表現方法です。Amazon QuickSightは棒グラフやヒートマップ、ツリーマップ等の表現方法をサポートしています。 ビジュアルを作成すると、フィールドに集計を追加する、フィルタを追加するといったような変更を加える事も出来るようになります。
ビジュアルの詳細については以下をご参照ください。
ストーリー(Stories)
『ストーリー(Story)』は分析の異なるイテレーションを再現出来る1つ以上のシーンの集合体です。ここでの『シーン』は任意の指定時間時点での表示内容です。その当時時点での分析・ビジュアルを表示していますが、継続して更新されて行きます。ですので、静的なスナップショットという訳でもありません。ストーリーで使用するシーンをキャプチャ出来ます。
ストーリーの詳細については以下をご参照ください。
ダッシュボード(Dashboards)
ダッシュボード(Dashboards)は、レポート用にAamazon QuickSight上で他ユーザーと共有する事が出来る、分析の読み取り専用スナップショットです。ダッシュボードを作成しPublishすると、アクセス可能なユーザーを指定する事が出来ます。指定されたユーザーはダッシュボードのデータを参照し、フィルタリングする事が出来ます。
ダッシュボードの詳細については以下をご参照ください。
一般的なAmazon QuickSight可視化フロー (Typical Amazon QuickSight Workflow)
分析を作成する際の一般的なワークフローは以下の流れとなります。
- 1).データソースに接続してデータセットを作成、または既存データセットを選択。
- 2).(オプション)新規データソース作成の場合、データの準備(フィールド名やデータ型の変更等)を行う。
- 3).新規で分析(Analysis)を作成。
- 4).可視化するためのフィールドを選択またはサジェッションを選択してビジュアルを分析に追加。Amazon QuickSightは選択したフィールドの数とデータ型に基いて、最も適したビジュアルの型で選択したデータを表示します。
- 5).(オプション)要件を満たすために、フィルタの追加やビジュアルの表示形式を切り替えてビジュアルを変更。
- 6).(オプション)ビジュアルを分析に追加。
- 7).(オプション)分析データの幾つかの側面に関する物語を提供する為に、シーンをデフォルトのストーリーに追加。
- 8).(オプション)気づきや洞察を共有する為に、ダッシュボードとして分析を公開。
以下画像はAmazon QuickSightワークフローの一般的な流れを示したものです。
まとめ
という訳で、Amazon QuickSightの概要に関する内容のご紹介でした。Amazon QuickSightを構成する要素についてはある程度把握出来たのではないかと思います。一方で、それぞれはどうやって構成するんだろう?という部分も出て来ているかと思いますのでその辺りについても適宜内容をご紹介して行きたいと思います。こちらからは以上です。