『Tableauとのデータブレンディングを高速化するAlteryxの6つ(+α)のステップ』を読んでみた
先日、SNSをウォッチしていたところ、『6 Steps to Faster Data Blending for Tableau』というホワイトペーパーに関する情報が目に留まりました。AlteryxとTableauの連携に関するもので、Tableauを利用するにあたってAlteryxをこういう風に使えばより効率良く作業が進められます!というコツを紹介した内容でした。
ツールの使い方そのものを紹介している訳では無いのですが、こういう局面ではこういう使い方をすれば良い、という部分の概略的なものは掴めそうな資料だったのでさくっと読んでみました。Alteryxに興味を持っている方々、若しくは実際に使い始めている方々の参考に少しでもなれば幸いです。
目次
- Tableauの"データブレンディング"
- Tableauの為の高速データブレンディング
- TableauのためAlteryxビジュアル解析キット
- より高速なデータブレンドのレシピ
- その他参考リソース
- まとめ
Tableauの"データブレンディング"
『データブレンディング』とは、実現可能な分析用のデータセットを作成する為に、複数のデータソースからデータを組み合わせるプロセスです。Tableauユーザーにとってはこの処理は重要な部分を占める一方で、時間が掛かるプロセスでもあります。
Tableauは分析者に対し自らの組織に対する効果的な洞察力を提供出来る能力を提供します。意思決定者がTableauの可視化された分析の価値を認識して行くに従い、分析者はより一層、データの可視化に伴うボリュームの多さ、(データ内容の)複雑さに対処する方法について考えていかなければいけません。
分析者に対して日々の仕事の中で、以下の様な作業に時間を費やす事を強いられている事と思います。
- 分析に適したデータが出来るまでの長時間の待機
- 異なるデータセットの準備(手動)と統合
- 多くの決定が必要となる高度な分析の欠如
Alteryxはこれらの作業に費やす時間と労力を減らす為のデータブレンディング機能を提供しています。以下ご紹介する内容はTableauでより高速なデータブレンディングを行うためのレシピをご紹介します。
Tableauの為の高速データブレンディング
ビジネス上の問題に対する真実を得る為のビューを作成するためには、分析者は多くのデータソースを必要とします。 Tableauのように、Alteryxは分析者がコーディングスキルや専門スキルを必要としないで済むような、グラフィカルなワークフローで構築出来るように作られています。
ユーザーは、既存のシステムのデータを活用出来ます。例えば、クラウド上のデータウェアハウスやHadoopのような大きなデータシステムとデスクトップ上のデータをブレンドする事が可能です。必要なデータセットをすぐに作成し、その内容をTableuaに直接レンダリングする事が出来ます。Tableauの為のデータブレンディング機能では、以下の様な作業が行えます。
- データクレンジング
- データの統合
- データの変換
- データの濃縮
TableauのためAlteryxビジュアル解析キット
『Tableau Kit』では、事前に構築済の分析用アプリケーションと、それらに対応する視覚化情報を提供します。詳細については以下ブログエントリにまとめていますので宜しければご参照ください。
この『Tableau Kit』を使う事で、以下の様な作業がよりスムーズに、効果的に行えるようになります。
- 調査分析
- 高度なデータ分レンディング
- XML解析
- Tableauにポリゴンを送信
- マルチチャンネル分析
- A/Bテスト
- マーケットバスケット分析
- ドライブ時間分析
より高速なデータブレンドのレシピ
1.分析に必要なデータをあらゆるデータソースから取得する
[Input Tool]を使う事によって、ワークフローを構築するためにデータソースをAlteryxキャンバスにドラッグアンドドロップ出来るようになります。
- [Input Tool]の設定ペインを使い、それぞれのデータソースを選択。
- ワークフローの後半で変更を加える必要がある場合、ブレンドする前に事前にデータセットをプレビューで確認する事も出来ます。
より良い分析の為のレシピは以下の通り。
- データソースにアクセスするための適切な認証情報を持っている事を確認
- データ内にどのような問題があるかどうかを理解しておく
- どのようにワークフロー内でデータを変換するかのプランを立てておく
2.データを速やかにクレンジング(外れ値、重複データ、その他データノイズの除去)
データセットにアクセスした後は、データブレンディング及び分析のための準備作業を行える用になります。以下例の場合、サンプルツールを使い、異常値とノイズの多いデータを削除しています。
この他にも、関心のあるデータのサブセットのみを分離したい場合はFilterツールを、また、重複データの削除にはUniqueツールを...等といった感じで用途に応じたツールを使う事が出来ます。
より良い分析のためのレシピは以下の通り。
- 複数のデータセットを一緒に持って来れるように、製品名やカテゴリ、ユーザーIDの統一を図っておく
- 用語の分類(大分類・中分類等の定義分け)をしっかりしておく事で、一貫性のあるカテゴリ名の作成が行える。
3.可視化の為のデータ最適化
列やリネームフィールドに行を移動する事により、可視化の為のデータ最適化を行います。
Alteryxキャンパスに『Transpose』のアイコンをドラッグし、フォーマットを行う為に柱状のデータを配置します。 可視化情報を読み易くする為にフィールドの名前を変更するツールを使用、数式ツール(Formura Tool)を使用してセルから値を取得し、データの他の行に再利用する事が出来ます。
より良い分析のためのレシピは以下の通り。
- Tableau用に最適化を行う為に、ラベル付け等を行います。
- 顧客細分化のExperian Mosaic Dataのような、サードパーティ製の人口統計学データを関連付ける事も出来ます。
4.異なる全てのデータソースから必要な特定のデータを登録
『Union Tool』を使い、各データのストリームを受け入れ、単一のストリームへと組み合わせます。 以下例では『SKU番号』をキーとして『顧客取引』に『製品詳細』を追加しています。幾つかのケースでのフィールド値が一致していませんが、Alteryxの『Fuzzy Match』を使用してとにかくそれらを結合する事は出来ます。
より良い分析のためのレシピは以下の通り。
- Alteryxの『Fuzzy Match Tool』を使って完全には一緒にしないフィールドも併せて取得
- Fuzzy Matchはスタイルを事前に設定してあり、正確では無い重複値を識別したり、それらをマージ・パージする事に使うことが出来ます。
5.手動で式やデータをコピーする事無く分析の準備が出来るようにデータを変換する
顧客IDによってトランザクションの数をカウントする『Summarize Tool』を使います。そして、再び『Summarize Tool』を使う事で購入値を合計する事が出来ます。
より良い分析のためのレシピは以下の通り。
- Alteryxでは、データ変換に関する数多くのツールを提供しています。
- ホワイトペーパー『Mastering Survey Analytics with Alteryx and Tableau』では可視化の為のデータ変換についてより詳細な解説が成されています。(このホワイトペーパーも要チェックですね!)
6.ファイルを探す時間を省き、Tableauを直接起動して結果を出力
ファイルを探す時間を費やさないでください - AlteryxからTableauを直接起動してしまいましょう。
AlteryxはTableau TDEファイルを直接出力する事が出来ます。このファイルフォーマットは、可視化ビューの視覚エフェクトをレンダリングする前にコンパイルする事によりパフォーマンス向上が見込めるものとなっています。また、Alteryxは元になるデータを更新し、結果をダッシュボードに表示するTableauワークブックを立ち上げる事が出来ます。
より良い分析のためのレシピは以下の通り。
- Tableau Server上のTDEファイルに対する差分更新を実現する為にAlteryx Serverのスケジュール機能を使うことも検討してみましょう。可視化ビューが常に最新の状態を保てる様になります。
(Bonus).Alteryxの『高度な分析機能』を使って顧客を獲得!
- 履歴データを使い、顧客の価値を『予測』する事が出来ます。
- 先週追加された顧客のうち、どの顧客が上位5%の『生涯価値を生み出す顧客』となるかを計算する事が出来ます。
- 他ベンダーへの転換により、どの顧客が最も乗り換える可能性が高いかを決定します。
- Alteryxはドラッグアンドドロップによる予測分析 - 分析者がコーディングの必要無しに分析を行える分析を提供します!
より良い分析のためのレシピは以下の通り。
- 強力な予測分析と空間分析の為の基礎として、ブレンドされたデータを使いましょう。
- Alteryxワークフローを新しい問題やデータセットに再利用 - これまでのノウハウ・知的財産を使って分析を進める事が出来ます。
その他参考リソース
Alteryx x Tableauのデータ連携に関する動画が以下のTableau特集ページにて紹介されています。
また、顧客事例に関するSlideshare資料や動画情報も以下ページにまとまっています。
まとめ
以上、AlteryxのTableau連携(主にデータブレンディング部分)に関するホワイトペーパーを読んでみたエントリのご紹介でした。こうしてみると、Alteryxは分析を行う上での様々な局面で利用出来るツールである事が分かりますね。Tableauとの親和性も非常に高く、分析業務に携わる方々にとっても力強いツールと成り得るのではないでしょうか。今回読んでみたホワイトペーパーは『データブレンディング』をメインとした内容でしたが、Alteryxの強みはこれだけで無く、実に多種多彩な『分析』に関するツール類が充実しているという側面もあります。こちらの『分析』に関する部分についても適宜ご紹介して行ければと思います。(その前に各種分析手法を勉強しないとですね...) こちらからは以上です。