[小ネタ]AlteryxとTalendで書式設定をしたExcelファイルを読み込んでみた
こんにちは。DI部の大高です。
AlteryxとTalendではExcelファイルを読み込むことも出来ますが、書式設定がされているExcelのデータはどうなるか気になったので確かめてみました。
前提条件
AlteryxとTalendは、それぞれ以下を利用して確認しています。
- Alteryx 非管理者 Designer / Version: 2019.1.6.58192
- Talend Open Studio for Big Data / Version: 7.1.1.20181026_1147
読み込むExcelファイル
読み込むExcelファイルは以下のようなファイルです。フリガナの設定と、数値に対して通貨の書式設定をかけてみました。このファイルを「Sample.xlsx」として保存し、更に「Sample.xls」(97-2003)としても保存して2ファイルで試します。
Alteryxの場合
Alteryxでは以下のようなワークフローを作成しました。見た通り「データ入力」ツールで読み込んで「閲覧」ツールで表示するだけのワークフローです。
結果は以下の通りです。「Sample.xls」、「Sample.xlsx」のどちらもフリガナ、数値の書式設定がなくなったデータが読み込まれていますね。
Talendの場合
Talendでは以下のようなジョブを作成しました。こちらも「tFileInputExcel」で読み込んで「tLogRow」で結果を出力するだけのワークフローです。なおスキーマ定義では全てのカラムをString
として設定しています。
結果は以下の通りです。「Sample.xlsx」はAlteryxと同じですが、「Sample.xls」が意外な結果になっています。Price
の値の先頭に$
が付いており、更に桁区切りの記号,
が付いたままとなっていますね。このあたりはデータの扱いに注意が必要そうです。
.--+---------------------------------------+------. | tLogRow_1 | |=-+---------------------------------------+-----=| |No|Title |Price | |=-+---------------------------------------+-----=| |1 |劇場版 仮面ライダービルド Be The One |$6,192| |2 |平成仮面ライダー20作記念 仮面ライダー平成ジェネレーションズ FOREVER|$7,115| |3 |ビルド NEW WORLD 仮面ライダークローズ |$9,720| '--+---------------------------------------+------' .--+---------------------------------------+-----. | tLogRow_2 | |=-+---------------------------------------+----=| |No|Title |Price| |=-+---------------------------------------+----=| |1 |劇場版 仮面ライダービルド Be The One |6192 | |2 |平成仮面ライダー20作記念 仮面ライダー平成ジェネレーションズ FOREVER|7115 | |3 |ビルド NEW WORLD 仮面ライダークローズ |9720 | '--+---------------------------------------+-----'
まとめ
以上、書式設定されたExcelをAlteryxとTalendで読み込んでみた結果でした。Excelは自由な書式設定が出来る一方で、読み込んだ際に想定外のデータになったりすることもあるようなので注意が必要ですね。
それでは!