Tableau Prepで出来る事のまとめ #tableau

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

こんちわ。大阪オフィス唯一のDI部メンバー、tamaです。

Tabelauの新バージョンや新しいライセンス体系など、Tabelauに関する多くの事が刷新されてきておりますが、もう一つ、重要なリリースがありました。それがTabelau Prepの登場です。

Tabelau Conference 2016で発表されて以来、「Project Maestro」というプロジェクト名で開発がなされていた製品ですが、ついにその名を「Tabelau Prep」として堂々のリリースとなりました。

以前より何度か触れてきた製品ではありますが、こちらはノンプログラミングでデータ前処理が実行できる製品となっております。Tableauでの位置付けとしては、Tableau Desktopでビジュアライゼーションを作成する前の段階で使用することが想定された製品となります。(Prepでデータをキレイな形に整形→Desktopで可視化、といった具合です)

今回は、Tabelau Prepで出来ること(=データに対する処理の種類)について、広く浅く見ていきたいと思います。

Tabelau Prep(Project Maestro)に関するエントリ

「Project Maestro」に関するエントリをいくつか執筆しております。あわせてご覧ください。

その他関連リンク

各Step紹介

Tabelau Prepでは、データに対する処理を、おもちゃのブロックのように1つずつ組み合わせて一連の処理を作成します。その処理のことを「Step」と言いますが、ここではどのようなStepがあって、そのStepではどのようなことができるのか、ザクっとご紹介していきます。

Input Step

処理したいデータを読み込むStepです。画面左の「+」アイコンから作成したり、ファイルをドラッグアンドドロップすることでInput Stepを作成できます。Stepに描かれているアイコンはデータの種類を表しています。Tabelau Prepは、基本的にこのStepから始めることになると思われます。

対応データソース

  • Microsoft Excel
  • Tableau抽出ファイル
    • .tde
    • .hyper
  • テキストファイル
    • .csv
  • Amazon Aurora
  • Amazon Redshift
  • Aster Database
  • Denodo
  • EXASOL
  • Google Cloud SQL
  • HP Vertica
  • Kognitio
  • MemSQL
  • Microsoft SQL Server
  • MySQL
  • Oracle
  • Pivotal Greenplum Database
  • PostgreSQL
  • Teradata

Clean Step (Clean Step, Change Pane, and Toolbar)

値の置換や分割、型の変更など、基本的なデータ前処理を行うStepです。Stepとしては1個ですが、この中で複数の処理を実行することが可能です。それらの処理がどれだけあって、どのような順番なのかは、Change Paneで確認することができます。

出来る処理

  • 計算フィールドの作成
    • Tableau Desktopと同じ仕様です。
  • カラムのデータ型の変更
  • 値の編集
  • 値の除外
  • 値のフィルタリング
  • 値のグループ化
  • 指定した値を残す
  • カラムのマージ
  • カラム名の変更
  • 値の分割

Union Step

その名の通り、同じカラムのデータ同士をユニオン処理し、1つのデータにすることができます。

Join Step

2つのデータ同士を、共通するキーを元に結合します。

選択できるJoinの種類

  • Inner Join
  • Left Inner Join
  • Right Inner Join
  • Full Outer Join
  • Left Outer Join
  • Right Outer Join
  • Full Anti Join

Pivot Step

列を行に変換します。例えば売上が記載されているカラムが、それぞれ「2000年、2001年、2002年…」と年別に値が分かれてしまっているようなカラム群を、「売上」というカラムに統一することができます。

Aggregate Step

簡単にいうと集計するStepです。データを指定したグループに応じて集計し、データの粒度を変更します。(年代毎に売上を集計する等)

Output Step

色々な処理を施したデータを、ファイルとして出力します。

出力可能なデータ形式

  • .csv
  • Tableau抽出ファイル
    • .tde
    • .hyper

ローカルへ保存するのではなく、Tableau Serverにデータソースとして直接パブリッシュすることもできます。

まとめ

Tabelau Prepは上記の処理を組み合わせてデータソースを分析しやすい形に整形していきます。1つ1つは単純な処理ですが、組み合わせることで多様なデータ前処理が可能となります。また、前処理したデータは、そのままTableau Serverへパブリッシュすることもできるので、まさにTabelauによる分析作業を加速させるツール…といった立ち位置にいる製品だと思います。

おわりに

冒頭で述べたように、今回はTableau Prepで出来る処理を広く浅く見てきました。今後はより実践的なフローの紹介等をしていきたいと思います。