Tableau Prep 2018.1.2 新機能:データインタープリターでキレイにしたExcelシートをワイルドカードユニオンする #tableau
はじめに
こんちわ。大阪オフィス唯一のDI部メンバー、tamaです。
去る6月にTableau Prepが2018.1.2にアップデートされていますが、その際、大規模なものではありませんが、新機能が追加されていました。ということで今回はその機能の1つをご紹介したいと思います。(忘れてたわけではないですよ…ええ…)
概要
「データインタープリターでキレイにしたExcelデータをワイルドカードユニオンする」とはどういうことでしょうか?
データインタープリターという機能はご存知でしょうか。当ブログでも何度か登場していますが、Tableau Prepだけではなく、Tableau Desktopにも搭載されている機能の1つです。複雑な構造をしていたり、余計な文言が入っているExcelデータは多いと思いますが、それらからデータに該当する部分だけ自動的に切り出してくれる機能がデータインタープリターです。
前述した通り、データインタープリターはTableau Prepにも搭載されています。今回の新機能は、データインタープリターで整形した複数のシートをそのままユニオン(ワイルドカード指定で)できるというものです。
例えば、「売上.xlsx」みたいなExcelファイルがあって、中身は年別にシートが別れていて、さらに中身はキレイな表にはなっておらず、複雑な列構造になっていたり、余計な補足コメントがセルを陣取っていたりして、とても分析できないッッ…みたいな状況、見覚えはないでしょうか。そういった時、この機能を使用すれば、手作業でいちいち整形することなく、年別に別れているデータをスッと1つのデータにユニオンすることができますね。
実践
サンプルデータの用意
今回は下記のExcelデータを使用します。簡易的ではありますが、表部分と関係のない部分に文章があったり、セル結合されていたりします。
とりあえず接続
上記のサンプルデータに、Tableau Prepで接続します。やはり、コメント部分が列名として認識されており、このままではキレイなデータに整形することはかないません。
データインタープリターON!!
データインタープリターにチェックを入れると、データ一覧が下記のようになります。この虫眼鏡みたいなアイコンがついているシートが、データインタープリターで整形後のシートになります。
データインタープリター後のシートをユニオンする
さて、各シートが整形されたので、後はこれらのシートをユニオンしたいと思います。
整形後のシートのいずれか1つをフローにドラッグします。そして、Wildcard unionにチェックを入れます。最後に、整形後のシートだけを拾ってくるように、ワイルドカードを指定します。今回はとりあえずコロンを使いました。
すると、上記のように整形後のシートだけを拾うことに成功したので、Applyを選択しましょう。データがユニオンされていくと思います。
今回はシート数が少ないですが、実際の業務データ等になると、もっと大量のシート数になると思うので、そういった時に、データインタープリター後のシートをワイルドカードで持ってこれると楽ですよね。
結果を確認
実際にユニオンできてますね。
ちなみにフィールド名が違っていて、列が分離している場合は、列をドラッグしてもう片方の列に重ねればマージできます。このデータだと「デビュー」と「Debut」をマージしたいので、片方をドラッグして重ねると、以下のようにマージできます。
おわりに
今回はTableau Prep 2018.1.2で追加された新機能について見ました。ちょっと地味ではありますが、データ前処理が確実に楽になる機能と思いますので、最近Tableau Prep触ってないなーという方がいたら、ぜひ使ってみて下さい。