[Alteryx Designer:ツールのご紹介]データ出力ツールについて
Alteryx絶賛勉強中のshoです。
はじめに
Alteryxでは、認定試験を受けることができ、初級から中級レベルの試験が、Alteryx Designer Coreとなっています。
Alteryxの認定試験の詳細については、こちらにて紹介しています。
Alteryx Designer Coreを受験するにあたっては、各種ツールの理解を深めておく必要があります。
今回は以下のページにて、“データ出力”ツールについて学んで行きたいと思います。
データ出力ツール(Output Data Tool)
データ出力ツールは、データを書き込む際に使用するツールです。
ファイルやデータベースにデータを書き込むことが可能です。詳しくは、データ出力ツールの“ファイルタイプ”と“データベース”をご確認ください。データ出力ツールの特徴として、入力アンカーのみで出力アンカーがないことが挙げられます。
今回は、よく使う以下のファイルに関してみていきたいと思います。
- CSVファイル
- Excelファイル
- Alteryxデータベースファイル
以下のいずれかの方法でデータ出力ツールをワークフローに追加することが可能です。
- ツールの一覧から“お気に入り”カテゴリ、あるいは“入出力”カテゴリにあるデータ出力ツールを選択し、キャンバスにドラッグ
- キャンバス内にて、右クリックより“挿入”を選択し、“お気に入り”カテゴリ、あるいは“入出力”カテゴリにあるデータ出力ツールを選択
- 右上の検索画面にて“output”と入力し、データ出力ツールを選択
上記にて、追加したデータ出力ツールを選択し、参照ボタン“▼”をクリックします。
書き込み対象の既存のファイル、もしくは新規ファイルを指定します。
CSVファイル
データ出力ツールは、CSVファイルを読み込み対象として指定した後、以下の内容について指定が可能です。
- ファイルごとの最大レコード数:
1ファイルに対して書き込むデータの最大行数を指定(数値を入力)します。
デフォルトでは指定がないため、すべてのデータを1ファイルに書き込みます。
指定した最大行数以上のレコードが存在する場合には、別ファイルが新たに生成されます。 - 区切り記号:
データの区切り文字を設定します。 - 先頭行にフィールド名を含める:
先頭行にフィールド名を含める場合には、チェックを入れます。
デフォルトでは、有効化されていますのでフィールド名が不要な場合には無効化してください。 - 出力フィールドを引用:
出力したデータ内に、引用符が含まれる場合に、その引用符をデータ内に含めるオプションを指定します。 - 常に非表示
- 自動(デフォルト)
- 常に
- コードページ:
出力対象のデータの文字コードを指定します。 - 行終了スタイル:
改行コードの種類を指定します。 - Windows(デフォルト)
- Unix
- Mac
Excelファイル
データ出力ツールは、Excelファイルを読み込み対象として指定した後、以下の内容について指定が可能です。
- ファイルごとの最大レコード数:
1ファイルに対して書き込むデータの最大行数を指定(数値を入力)します。
デフォルトでは指定がないため、すべてのデータを1ファイルに書き込みます。
指定した最大行数以上のレコードが存在する場合には、別ファイルが新たに生成されます。 - 出力オプション:
ファイルに出力する際に、既存のものに上書きするか、新規に作成するかを指定します。
デフォルトでは、“新しいシートを作成する”と設定されているため、2回以上ワークフローを実行するとすでにファイルがあるためエラーが発生します。必ず設定を変更するか、他のオプションを設定してエラーを回避してください。 - 既存のシートに上書き
- シートまたは範囲を上書き
- ファイルを上書き(削除)
- 新しいシートを作成する(デフォルト)
- フィールドマップを追加:
ワークフロー内のデータをファイルに書き込む際のフィールドについて設定します。 - フィールド名で
- カスタムマッピング
- フィールド名をスキップ:
先頭行にフィールド名を含めずに出力する場合に、チェックを入れます。
デフォルトでは、無効化されていますのでフィールド名が不要の場合は有効化してください。 - Preserve Formatting on Overwrite(Rainge Required):
範囲指定をした上で、既存の書式設定を維持する場合に設定します。
本機能は2020.1にて新たに追加された機能となりますので、詳細につきましてはこちらをご参照ください。
Alteryxデータベースファイル
データ出力ツールは、Alteryxデータベースファイルを読み込み対象として指定した後、以下の内容について指定が可能です。
- ファイルごとの最大レコード数:
1ファイルに対して書き込むデータの最大行数を指定(数値を入力)します。
デフォルトでは指定がないため、すべてのデータを1ファイルに書き込みます。
指定した最大行数以上のレコードが存在する場合には、別ファイルが新たに生成されます。 - 空間インデックスなし:
空間インデックスを含めない場合に、有効化します。
デフォルトでは、無効化されているため含めない場合はチェックを入れ有効化してください。 - ソースと説明を保存:
メタ情報にデータソースと説明のデータが含める場合に設定します。
デフォルトでは有効化されているため、不要な場合は、チェックを外して無効化してください。
データ出力(Output Data)ツールを使う上でのコツ
ワークフローと同ディレクトリに出力ファイルを保存する場合
通常、出力ファイルのファイルURLは以下のようにフルパスを指定します。
C:\Users\[ユーザー名]\Desktop\Alteryx\source\*.csv
一方、以下のように設定することで、ワークフローと同ディレクトリ上にファイルを出力することが可能です。
\.\sales.output.csv
複数のファイルにデータを出力する場合
出力オプションの“フィールドからファイル/テーブル名を取得する”機能を活用することで、フィールド情報を使用して複数のファイルにデータを分けることが可能です。
上記設定にて、ワークフローファイルの同ディレクトリ上に、“Year”フィールドにあるデータに応じて、“sales.output[年].csv”が生成されます。
このオプションは、以下のいずれかを指定する必要があります。
- 接頭辞をファイル/テーブル名に付加する
- 接尾辞をファイル/テーブル名に付加する
- ファイル/テーブル名を変更
- ファイルパス全文を変更する
詳細につきましては、以下の関連エントリをご確認ください。
- Alteryxで複数のファイルを読み込み、ファイルごとに出力する
- AlteryxからExcelファイルにファイルを分けてデータを出力したい
- AlteryxでデータをExcelファイルにシートを分けて出力したい
最後に
Alteryx Designerのデータ出力ツールについて、まとめてみました。
データ出力ファイルを活用することで、様々な形式でデータを出力することが可能です。
また、新規にファイルを作成することも、既存のファイルにデータを追加することもできるので、分析完了後のツールとしてご活用ください。
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。