[小ネタ]AlteryxとTalendで書式設定をしたExcelファイルを読み込んでみた

こんにちは。DI部の大高です。

AlteryxとTalendではExcelファイルを読み込むことも出来ますが、書式設定がされているExcelのデータはどうなるか気になったので確かめてみました。

前提条件

AlteryxとTalendは、それぞれ以下を利用して確認しています。

  • Alteryx 非管理者 Designer / Version: 2019.1.6.58192
  • Talend Open Studio for Big Data / Version: 7.1.1.20181026_1147

読み込むExcelファイル

読み込むExcelファイルは以下のようなファイルです。フリガナの設定と、数値に対して通貨の書式設定をかけてみました。このファイルを「Sample.xlsx」として保存し、更に「Sample.xls」(97-2003)としても保存して2ファイルで試します。

Alteryxの場合

Alteryxでは以下のようなワークフローを作成しました。見た通り「データ入力」ツールで読み込んで「閲覧」ツールで表示するだけのワークフローです。

結果は以下の通りです。「Sample.xls」、「Sample.xlsx」のどちらもフリガナ、数値の書式設定がなくなったデータが読み込まれていますね。

Talendの場合

Talendでは以下のようなジョブを作成しました。こちらも「tFileInputExcel」で読み込んで「tLogRow」で結果を出力するだけのワークフローです。なおスキーマ定義では全てのカラムをStringとして設定しています。

結果は以下の通りです。「Sample.xlsx」はAlteryxと同じですが、「Sample.xls」が意外な結果になっています。Priceの値の先頭に$が付いており、更に桁区切りの記号,が付いたままとなっていますね。このあたりはデータの扱いに注意が必要そうです。

.--+---------------------------------------+------.
|                    tLogRow_1                    |
|=-+---------------------------------------+-----=|
|No|Title                                  |Price |
|=-+---------------------------------------+-----=|
|1 |劇場版 仮面ライダービルド Be The One               |$6,192|
|2 |平成仮面ライダー20作記念 仮面ライダー平成ジェネレーションズ FOREVER|$7,115|
|3 |ビルド NEW WORLD 仮面ライダークローズ               |$9,720|
'--+---------------------------------------+------'

.--+---------------------------------------+-----.
|                   tLogRow_2                    |
|=-+---------------------------------------+----=|
|No|Title                                  |Price|
|=-+---------------------------------------+----=|
|1 |劇場版 仮面ライダービルド Be The One               |6192 |
|2 |平成仮面ライダー20作記念 仮面ライダー平成ジェネレーションズ FOREVER|7115 |
|3 |ビルド NEW WORLD 仮面ライダークローズ               |9720 |
'--+---------------------------------------+-----'

まとめ

以上、書式設定されたExcelをAlteryxとTalendで読み込んでみた結果でした。Excelは自由な書式設定が出来る一方で、読み込んだ際に想定外のデータになったりすることもあるようなので注意が必要ですね。

それでは!