Tableau Prep 2018.1.2 新機能:データインタープリターでキレイにしたExcelシートをワイルドカードユニオンする #tableau

分析し難い形に構成された複数のExcelシートをユニオンせよ
2018.07.26

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

こんちわ。大阪オフィス唯一のDI部メンバー、tamaです。

去る6月にTableau Prepが2018.1.2にアップデートされていますが、その際、大規模なものではありませんが、新機能が追加されていました。ということで今回はその機能の1つをご紹介したいと思います。(忘れてたわけではないですよ…ええ…)

概要

「データインタープリターでキレイにしたExcelデータをワイルドカードユニオンする」とはどういうことでしょうか?

データインタープリターという機能はご存知でしょうか。当ブログでも何度か登場していますが、Tableau Prepだけではなく、Tableau Desktopにも搭載されている機能の1つです。複雑な構造をしていたり、余計な文言が入っているExcelデータは多いと思いますが、それらからデータに該当する部分だけ自動的に切り出してくれる機能がデータインタープリターです。

前述した通り、データインタープリターはTableau Prepにも搭載されています。今回の新機能は、データインタープリターで整形した複数のシートをそのままユニオン(ワイルドカード指定で)できるというものです。

例えば、「売上.xlsx」みたいなExcelファイルがあって、中身は年別にシートが別れていて、さらに中身はキレイな表にはなっておらず、複雑な列構造になっていたり、余計な補足コメントがセルを陣取っていたりして、とても分析できないッッ…みたいな状況、見覚えはないでしょうか。そういった時、この機能を使用すれば、手作業でいちいち整形することなく、年別に別れているデータをスッと1つのデータにユニオンすることができますね。

実践

サンプルデータの用意

今回は下記のExcelデータを使用します。簡易的ではありますが、表部分と関係のない部分に文章があったり、セル結合されていたりします。

とりあえず接続

上記のサンプルデータに、Tableau Prepで接続します。やはり、コメント部分が列名として認識されており、このままではキレイなデータに整形することはかないません。

データインタープリターON!!

データインタープリターにチェックを入れると、データ一覧が下記のようになります。この虫眼鏡みたいなアイコンがついているシートが、データインタープリターで整形後のシートになります。

データインタープリター後のシートをユニオンする

さて、各シートが整形されたので、後はこれらのシートをユニオンしたいと思います。

整形後のシートのいずれか1つをフローにドラッグします。そして、Wildcard unionにチェックを入れます。最後に、整形後のシートだけを拾ってくるように、ワイルドカードを指定します。今回はとりあえずコロンを使いました。

すると、上記のように整形後のシートだけを拾うことに成功したので、Applyを選択しましょう。データがユニオンされていくと思います。

今回はシート数が少ないですが、実際の業務データ等になると、もっと大量のシート数になると思うので、そういった時に、データインタープリター後のシートをワイルドカードで持ってこれると楽ですよね。

結果を確認

実際にユニオンできてますね。

ちなみにフィールド名が違っていて、列が分離している場合は、列をドラッグしてもう片方の列に重ねればマージできます。このデータだと「デビュー」と「Debut」をマージしたいので、片方をドラッグして重ねると、以下のようにマージできます。

おわりに

今回はTableau Prep 2018.1.2で追加された新機能について見ました。ちょっと地味ではありますが、データ前処理が確実に楽になる機能と思いますので、最近Tableau Prep触ってないなーという方がいたら、ぜひ使ってみて下さい。

参考