データ接続〜自動分割とカスタム分割の使用方法を理解する #tableau

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

お早うございます。大阪オフィス唯一のDI部メンバー、tamaです。

本エントリは、Tableau Desktop Qualified Associateの試験ガイド「評価するスキル」に関連する内容となります。

本エントリの概要

今回は「自動分割とカスタム分割の使用方法を理解する」ということで、データ準備の際に使用できる分割機能について見ていきます。

そもそも「分割」とは?

Tableau Desktopを起動して、何らかのデータに接続したとき、まず始めに上記のデータ接続画面が表示されると思います。ここで、データの内容を概観したり、データの型を変更したりすることができますが、ここで出来る事の1つとして「分割」機能があります。

分割機能についてですが、言ってしまえば非常にシンプルな機能でして、「文字列フィールドに対して、特定の区切り文字毎にカラムを分ける機能」というものになります。

分割機能には2つの種類があります。

自動分割

分割したいカラムを右クリックしてメニューを出します。ここの「分割」というメニューを選択すると、「自動分割」が行われます。今回はサンプルスーパーストアの「オーダーID」を自動分割します。

「分割」を選択すると、下記のようにカラムが分割されました。

自動分割は、その名の通り、あくまでTableauが自動で行う処理のため、ユーザーの想定通りに分割されないパターンも発生し得ます。その場合は「カスタム分割」を使用して、分割条件を明確に指定してあげる必要があります。(自動分割の場合「JP-」が区切り文字と見なされる仕様になっているので、「JP-」というカラムは表示されません。)

他にも下記のような場合はカスタム分割を行う必要があります。

  • レコード毎に、区切り文字の数が違う場合
  • レコード内に、異なる種類の区切り文字が混在している場合

カスタム分割

自動分割が思い通りの結果にならなかったり、データの中身的に自動では上手くいかなさそうな場合は、カスタム分割を使用します。上記と同様のメニューから「カスタム分割」を選択すると、下記のメニュー画面が表示されます。

  • 区切り文字の使用
    • どの文字を区切り文字とみなして分割するか指定します。
  • 分割
    • 「最初/最後から数えて何列分を分割するか」を指定します。
    • すべてを選択すると、区切り文字がある分だけすべて分割します

例えば、区切り文字を「-」、分割を「最後」「1列」に指定すると、下記のような結果となります。

補足

対応データソースについて

実は、この分割機能の正体は計算フィールドのSPLIT関数です。上記のカスタム分割で作成されたカラムは「計算フィールド」となっており、このカラムを右クリックして「編集」を選択すると、下記の計算フィールド編集画面となります。カスタム分割の設定でも実現できないようなルールでの分割を行いたい場合は、こちらに関数を記述していく形になります。

SPLIT関数は使用できるデータソースに制限があります。すなわち、この分割機能が使用できるデータソースにも制限があるため、注意が必要です。具体的な対応データソースのリストについては、当エントリ下記の参考リンクをご覧ください。

Qualified Associateでは…

実業務でも、ちょっとした処理として役立ちそうな「分割機能」ですが、Qualified Associateでも、こちらを使用することを想定した問題が出題されます。

明確に分割機能を使え、というようなことは一切書いていないのですが、「○○の売上はいくらか?」といった問題で、指定されたデータソースをよくよく見てみると、分割しないと分析できないカラムだった…というパターンの問題があります。分割機能を知っていれば何のことはありませんが、逆に分割機能を知らないと、どうしようもなくなる可能性もあるため、「こういう機能がある」ということは知っておいた方がいいでしょう。

おわりに

今回は分割機能について見てきました。地味な機能ですが、ちょっとした前処理に使える機能ですので、抑えておくと便利かと思います。

参考