#02 : Alteryxサンプルワークフロー「様々なファイル形式の注文データをブレンド」- Alteryx & Tableau 連携 Advent Calendar 2018
当エントリは『Alteryx&Tableau連携 Advent Calendar 2018』シリーズの02本目のエントリです。
- Alteryx & Tableau 連携 Advent Calendar 2018 - Qiita
- Alteryx & Tableau 連携 Advent Calendar 2018 | シリーズ | DevelopersIO
当エントリでは、Alteryx Designerの実行ワークフローサンプル「Blend Order Data with Numerous Supporting Datasets(様々なファイル形式の注文データをブレンド)」の内容を紹介します。
目次
「本日のテーマ」概要紹介
AlteryxとTableauはそのツール特性から非常に相性が良く、製品間それぞれにパートナー企業としての(特集)ページが設けられています。
本日は、Alteryx Designerの「Sample Workflows」にて展開されている「Tableau Starter Kit」の中で、「Data Preparation」配下の「Blend Order Data with Numerous Supporting Datasets」というサンプルワークフローについて見ていきたいと思います。
このワークフローでは、様々なファイル形式の入力データを、Alteryxを使って入力データとして認識し、1つのアウトプットデータとして作り上げていく...という内容を実践しています。
ワークフローの全体像
サンプルワークフローの全体像は以下となります。
ワークフローを読み解く
Input Dataでは様々なデータソースを『入力元』とする事が可能です。このワークフローでは、EXCEL(.xlsx)、CSV(.csv)、テキスト情報、そしてAlteryxデータベースファイル(*.yxdb)入力元としてそれぞれのInput Data Toolで参照しています。
yxdb
Text Input
EXCEL
CSV
Join Toolでは、Account Idをキーとしてそれぞれの情報を結合しています。結合したカラムを含めたカラム名については任意の名称に変更する事が可能です。ここではより有意な名前としてCustomer_Name等の名称を設定しています。計2箇所で結合を行っているようです。
真ん中上部でのストリームでは、一旦キーで結合したもののうち、結合出来たもの(Join)と左辺にのみ存在するもの(Left)を、
直後のJoin ToolでUnion Toolで統合しています。これはSQLで言うところの「左外部結合(LEFT OUTER JOIN)」と同様の内容を実現している形となります。
- LEFT (OUTER) JOIN (左外部結合)を使ってデータを取得する - SQL Server 入門
- Solved: Simple Left Outer Join........ - Alteryx Community
- Alteryxで各種結合をする | DevelopersIO
一番下のストリームでは、入力ファイルに対してSelect Toolで必要となるカラムの選択及びカラム名のリネームを行っています。 Skusの方は特に変更は無いですが、Inventoryのデータについては一部データ型が異なるため、Skusのものと合うようにデータ型をDouble型に変更しています。また、合わせてカラム名も変更しています。
後はひたすらJoin Toolで必要な情報を、キーでくっつけて完全なるデータに整えていく...という処理を繰り返しています。
最後の「Output Tool」では、出力ファイル形式に「Tableau抽出ファイル(.hyper)」を指定(ファイルが存在していた場合は上書き)しています。この形式はTableauでより高速且つ軽量に処理を行うためのデータ形式で、手元にデータを圧縮した形で保持します。Tableau v10.5ではこの抽出ファイルの形式が従来の「.tde」から「*.hyper」に変わり、パフォーマンス面でも大幅な向上が見られるようになりました。
ここまでが当エントリで紹介するワークフローの全体像となります。
ワークフローの実行・Tableauワークブックの内容確認
画面右上の「Run」ボタン、または「Control」+「R」のショートカットでワークフローを実行。最終的にOutput Toolを介して抽出ファイルがhyper形式で作成されました。
抽出ファイルを実行して開いてみます。Tableauが起動し、データとして内容がひとまとまりになった形で参照する事が出来ました。
まとめ
という訳で、『Alteryx&Tableau連携 Advent Calendar 2018』2本目、「Blend Order Data with Numerous Supporting Datasets(様々なファイル形式の注文データをブレンド)」のご紹介でした。データ形式の種類が多数存在する場合だとまずどこかのデータベースに一式取り込んで...と思うところですが投入の仕組み自体が存在していなければその作業も骨の折れるものとなるでしょう。Alteryxを使う事で、様々なデータベース、データソースを同じインタフェースで扱えてまとめ上げる事が出来るのは手間が大幅に省けるのではないでしょうか。
引き続き、明日もお楽しみに!
- Alteryx & Tableau 連携 Advent Calendar 2018 - Qiita
- Alteryx & Tableau 連携 Advent Calendar 2018 | シリーズ | DevelopersIO
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。