Tableau Prepで出来る事のまとめ #tableau
はじめに
こんちわ。大阪オフィス唯一のDI部メンバー、tamaです。
Tabelauの新バージョンや新しいライセンス体系など、Tabelauに関する多くの事が刷新されてきておりますが、もう一つ、重要なリリースがありました。それがTabelau Prepの登場です。
Tabelau Conference 2016で発表されて以来、「Project Maestro」というプロジェクト名で開発がなされていた製品ですが、ついにその名を「Tabelau Prep」として堂々のリリースとなりました。
以前より何度か触れてきた製品ではありますが、こちらはノンプログラミングでデータ前処理が実行できる製品となっております。Tableauでの位置付けとしては、Tableau Desktopでビジュアライゼーションを作成する前の段階で使用することが想定された製品となります。(Prepでデータをキレイな形に整形→Desktopで可視化、といった具合です)
今回は、Tabelau Prepで出来ること(=データに対する処理の種類)について、広く浅く見ていきたいと思います。
Tabelau Prep(Project Maestro)に関するエントリ
「Project Maestro」に関するエントリをいくつか執筆しております。あわせてご覧ください。
- Project Maestro(Beta)で奈良県の統計データを前処理してみた #tableau #Maestro | Developers.IO
- 続・Project Maestro(Beta)で奈良県の統計データを前処理してみた(Join編) #tableau #Maestro | Developers.IO
その他関連リンク
- Tableau Conference 2016 at Austin レポートキーノートセッション”Tableau Vision” #data16 | Developers.IO
- Project Maestro発表
各Step紹介
Tabelau Prepでは、データに対する処理を、おもちゃのブロックのように1つずつ組み合わせて一連の処理を作成します。その処理のことを「Step」と言いますが、ここではどのようなStepがあって、そのStepではどのようなことができるのか、ザクっとご紹介していきます。
Input Step
処理したいデータを読み込むStepです。画面左の「+」アイコンから作成したり、ファイルをドラッグアンドドロップすることでInput Stepを作成できます。Stepに描かれているアイコンはデータの種類を表しています。Tabelau Prepは、基本的にこのStepから始めることになると思われます。
対応データソース
- Microsoft Excel
- Tableau抽出ファイル
- .tde
- .hyper
- テキストファイル
- .csv
- Amazon Aurora
- Amazon Redshift
- Aster Database
- Denodo
- EXASOL
- Google Cloud SQL
- HP Vertica
- Kognitio
- MemSQL
- Microsoft SQL Server
- MySQL
- Oracle
- Pivotal Greenplum Database
- PostgreSQL
- Teradata
Clean Step (Clean Step, Change Pane, and Toolbar)
値の置換や分割、型の変更など、基本的なデータ前処理を行うStepです。Stepとしては1個ですが、この中で複数の処理を実行することが可能です。それらの処理がどれだけあって、どのような順番なのかは、Change Paneで確認することができます。
出来る処理
- 計算フィールドの作成
- Tableau Desktopと同じ仕様です。
- カラムのデータ型の変更
- 値の編集
- 値の除外
- 値のフィルタリング
- 値のグループ化
- 指定した値を残す
- カラムのマージ
- カラム名の変更
- 値の分割
Union Step
その名の通り、同じカラムのデータ同士をユニオン処理し、1つのデータにすることができます。
Join Step
2つのデータ同士を、共通するキーを元に結合します。
選択できるJoinの種類
- Inner Join
- Left Inner Join
- Right Inner Join
- Full Outer Join
- Left Outer Join
- Right Outer Join
- Full Anti Join
Pivot Step
列を行に変換します。例えば売上が記載されているカラムが、それぞれ「2000年、2001年、2002年…」と年別に値が分かれてしまっているようなカラム群を、「売上」というカラムに統一することができます。
Aggregate Step
簡単にいうと集計するStepです。データを指定したグループに応じて集計し、データの粒度を変更します。(年代毎に売上を集計する等)
Output Step
色々な処理を施したデータを、ファイルとして出力します。
出力可能なデータ形式
- .csv
- Tableau抽出ファイル
- .tde
- .hyper
ローカルへ保存するのではなく、Tableau Serverにデータソースとして直接パブリッシュすることもできます。
まとめ
Tabelau Prepは上記の処理を組み合わせてデータソースを分析しやすい形に整形していきます。1つ1つは単純な処理ですが、組み合わせることで多様なデータ前処理が可能となります。また、前処理したデータは、そのままTableau Serverへパブリッシュすることもできるので、まさにTabelauによる分析作業を加速させるツール…といった立ち位置にいる製品だと思います。
おわりに
冒頭で述べたように、今回はTableau Prepで出来る処理を広く浅く見てきました。今後はより実践的なフローの紹介等をしていきたいと思います。