この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。
こんにちは。DI部の大高です。
AlteryxとTalendではExcelファイルを読み込むことも出来ますが、書式設定がされているExcelのデータはどうなるか気になったので確かめてみました。
前提条件
AlteryxとTalendは、それぞれ以下を利用して確認しています。
- Alteryx 非管理者 Designer / Version: 2019.1.6.58192
- Talend Open Studio for Big Data / Version: 7.1.1.20181026_1147
読み込むExcelファイル
読み込むExcelファイルは以下のようなファイルです。フリガナの設定と、数値に対して通貨の書式設定をかけてみました。このファイルを「Sample.xlsx」として保存し、更に「Sample.xls」(97-2003)としても保存して2ファイルで試します。
Alteryxの場合
Alteryxでは以下のようなワークフローを作成しました。見た通り「データ入力」ツールで読み込んで「閲覧」ツールで表示するだけのワークフローです。
結果は以下の通りです。「Sample.xls」、「Sample.xlsx」のどちらもフリガナ、数値の書式設定がなくなったデータが読み込まれていますね。
Talendの場合
Talendでは以下のようなジョブを作成しました。こちらも「tFileInputExcel」で読み込んで「tLogRow」で結果を出力するだけのワークフローです。なおスキーマ定義では全てのカラムをString
として設定しています。
結果は以下の通りです。「Sample.xlsx」はAlteryxと同じですが、「Sample.xls」が意外な結果になっています。Price
の値の先頭に$
が付いており、更に桁区切りの記号,
が付いたままとなっていますね。このあたりはデータの扱いに注意が必要そうです。
.--+---------------------------------------+------.
| tLogRow_1 |
|=-+---------------------------------------+-----=|
|No|Title |Price |
|=-+---------------------------------------+-----=|
|1 |劇場版 仮面ライダービルド Be The One |$6,192|
|2 |平成仮面ライダー20作記念 仮面ライダー平成ジェネレーションズ FOREVER|$7,115|
|3 |ビルド NEW WORLD 仮面ライダークローズ |$9,720|
'--+---------------------------------------+------'
.--+---------------------------------------+-----.
| tLogRow_2 |
|=-+---------------------------------------+----=|
|No|Title |Price|
|=-+---------------------------------------+----=|
|1 |劇場版 仮面ライダービルド Be The One |6192 |
|2 |平成仮面ライダー20作記念 仮面ライダー平成ジェネレーションズ FOREVER|7115 |
|3 |ビルド NEW WORLD 仮面ライダークローズ |9720 |
'--+---------------------------------------+-----'
まとめ
以上、書式設定されたExcelをAlteryxとTalendで読み込んでみた結果でした。Excelは自由な書式設定が出来る一方で、読み込んだ際に想定外のデータになったりすることもあるようなので注意が必要ですね。
それでは!