[小ネタ]AlteryxとTalendで書式設定をしたExcelファイルを読み込んでみた

[小ネタ]AlteryxとTalendで書式設定をしたExcelファイルを読み込んでみた

AlteryxとTalendでは、Excelファイルを読み込むことも出来ますが、書式設定がされているExcelのデータはどうなるか気になったので確かめてみました。
2019.06.26

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは。DI部の大高です。

AlteryxとTalendではExcelファイルを読み込むことも出来ますが、書式設定がされているExcelのデータはどうなるか気になったので確かめてみました。

前提条件

AlteryxとTalendは、それぞれ以下を利用して確認しています。

  • Alteryx 非管理者 Designer / Version: 2019.1.6.58192
  • Talend Open Studio for Big Data / Version: 7.1.1.20181026_1147

読み込むExcelファイル

読み込むExcelファイルは以下のようなファイルです。フリガナの設定と、数値に対して通貨の書式設定をかけてみました。このファイルを「Sample.xlsx」として保存し、更に「Sample.xls」(97-2003)としても保存して2ファイルで試します。

Alteryxの場合

Alteryxでは以下のようなワークフローを作成しました。見た通り「データ入力」ツールで読み込んで「閲覧」ツールで表示するだけのワークフローです。

結果は以下の通りです。「Sample.xls」、「Sample.xlsx」のどちらもフリガナ、数値の書式設定がなくなったデータが読み込まれていますね。

Talendの場合

Talendでは以下のようなジョブを作成しました。こちらも「tFileInputExcel」で読み込んで「tLogRow」で結果を出力するだけのワークフローです。なおスキーマ定義では全てのカラムをStringとして設定しています。

結果は以下の通りです。「Sample.xlsx」はAlteryxと同じですが、「Sample.xls」が意外な結果になっています。Priceの値の先頭に$が付いており、更に桁区切りの記号,が付いたままとなっていますね。このあたりはデータの扱いに注意が必要そうです。

.--+---------------------------------------+------.
|                    tLogRow_1                    |
|=-+---------------------------------------+-----=|
|No|Title                                  |Price |
|=-+---------------------------------------+-----=|
|1 |劇場版 仮面ライダービルド Be The One               |$6,192|
|2 |平成仮面ライダー20作記念 仮面ライダー平成ジェネレーションズ FOREVER|$7,115|
|3 |ビルド NEW WORLD 仮面ライダークローズ               |$9,720|
'--+---------------------------------------+------'

.--+---------------------------------------+-----.
|                   tLogRow_2                    |
|=-+---------------------------------------+----=|
|No|Title                                  |Price|
|=-+---------------------------------------+----=|
|1 |劇場版 仮面ライダービルド Be The One               |6192 |
|2 |平成仮面ライダー20作記念 仮面ライダー平成ジェネレーションズ FOREVER|7115 |
|3 |ビルド NEW WORLD 仮面ライダークローズ               |9720 |
'--+---------------------------------------+-----'

まとめ

以上、書式設定されたExcelをAlteryxとTalendで読み込んでみた結果でした。Excelは自由な書式設定が出来る一方で、読み込んだ際に想定外のデータになったりすることもあるようなので注意が必要ですね。

それでは!


データ分析基盤ならCSAにおまかせください!

クラスメソッドでは、データ分析に関わる皆様の作業コストを削減し、分析アクションを促進・効率化・自動化するためのデータ分析基盤「カスタマーストーリーアナリティクス」を提供・展開しています。興味をお持ち頂けた方は下記バナーをクリックし、詳細をご覧頂けますと幸いです。(各種問い合わせも承っております)

データ分析基盤を最短1ヶ月で導入可能


また、現在クラスメソッドでは毎週無料の相談会を開催しています。データ分析基盤の構築から、BIツール、データ統合など、ビッグデータ分析の導入や活用、技術についてお気軽にご相談ください。

データ分析相談会

この記事をシェアする

データ分析基盤を最短1ヶ月で導入できる

関連記事