[Alteryx Designer:ツールのご紹介]列分割ツールについて
Alteryx絶賛勉強中のshoです。
はじめに
セルフサービス分析ツールであるAlteryxでは、製品に関する認定試験を受けることができ、初級から中級レベルの試験が、Alteryx Designer Coreとなっています。
Alteryxの認定試験の詳細については、こちらにて紹介しています。
Alteryx Designer Coreを受験するにあたっては、各種ツールの理解を深めておく必要があります。
今回は以下のページから、“転置”ツールについて学んで行きたいと思います。
列分割ツール(Text To Columns)
列分割ツールは、1つのフィールド項目に含まれる値を名称の通り、分割するためツールです。
フィールド項目に複数のタイプのデータが存在する場合に、使用するツールとなります。
列分割ツールは、以下のいずれかの方法でワークフローに追加します。
- ツールの一覧から“パース”カテゴリにある列分割ツールを選択し、キャンバスにドラッグ
- キャンバス内にて、右クリックより“挿入”を選択し、“パース”カテゴリにある列分割ツールを選択
- 右上の検索画面にて“text to columns”と入力し、列分割ツールを選択
列分割ツールは、以下のいずれかの形に分割することが可能です。
- 列に分割
- 行に分割
クラスメソッドのオフィスのある地域の6月の気温の情報を取り込み、列分割ツールの動作についてみていきたいと思います。
出典:気象庁ホームページ(https://www.data.jma.go.jp/obd/stats/etrn/index.php)
今回のデータでは、日ごとの最高気温・最低気温・湿度が同じフィールド項目に含まれており、“最高気温/最低気温・湿度”という構成となっています。
列に分割
列分割ツールを使用する際には、まず分割対象となるフィールド項目と分割するための区切り文字を設定する必要があります。
デフォルトでは、“列に分割する”が設定されています。
列に分割する場合は、以下の3つの項目を設定します。
- 列数
- 超過した文字
- 最後の行に超過分を残す
- 警告付きで超過分を削除
- 警告なしで超過分を削除
- エラー
- 出力ルート名
“列数”では、そのフィールド項目をいくつの列に分割するかを設定します。
対象のフィールド項目に含まれるデータの構成にあわせて列数を指定してください。
“超過した文字”では、データを取り込んだ際に、指定したフィールド項目・区切り文字の設定にて列を分割した際に、上記にて指定した列を超過した値をどのように処理するかを設定します。
実際に、取り込むデータではどのようなケースで値が超過するケースがあるのかご確認頂き、その上で適切な設定を適用してください。
“出力ルート名”では、分割対象に指定したフィールド項目の名称を指定します。
デフォルトでは、取り込んだ際のデータ項目と同じ名称となっていますので、必要に応じて名称の変更を行って下さい。
“出力ルート名”に指定した名称の末尾に分割した列の何番目にあたるかが付加されます。
今回は、以下のように設定をしました。
- 列数:3
- 超過した文字:最後の行に超過分を残す
- 出力ルート名:列分割
その結果がこちら
行に分割
デフォルトでは、“列に分割する”が設定されているため、“行に分割する”に変更する必要があります。
その結果がこちら
共通設定
列分割ツールを使用する際には、まず分割対象となるフィールド項目と分割するための区切り文字を設定する必要があります。
区切り文字は複数設定することが可能です。
区切り文字の例
- スペース:\s
- タブ:\t
- 改行:\n
また、詳細設定では、引用符(クオーテーション)内の区切り文字をどのように扱うか指定することできます。
- 二重引用符(")内の区切り文字を無視する
- 一重引用符(')内の区切り文字を無視する
- 括弧内の区切り文字を無視する
- ブラケット([])内の区切り文字を無視する
- 空の列をスキップする
列分割ツールのおさえておきたいポイント
列分割ツールを使用して、列の中の値を分割した場合、データ項目名称がわかりづらい名称になっていたり、データ型が文字列型に統一されているため集計ができない状況になっていたりします。
その後の処理を実施するにあたっては、データ項目名称、データ型の変更を行って頂き、集計できる状態にしておくことをお勧めします。
また、列分割ツールを使用して行に分割する場合、各行がユニークであることが確認できるデータ項目が必要となりますので、その点もご注意ください。
最後に
Alteryx Designerの列分割ツールについて、まとめてみました。
複数のデータが同じ列内に存在する場合、この列分割ツールを使用することで、集計処理に役立てることができますので、集計の前処理などにをご活用ください。