AlteryxでExcelファイルを読み込む際の、注意点について

2022.08.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

皆さんこんにちは、清水です。 Alteryxを利用する際に、Excelを利用するケースがあるかと思いますが、データを読み込む際にNULLが入ってしまう現象に関して説明します。主に初学者向けの内容になるかと思います。

以下のブログも併せてご確認ください。

AlteryxでExcelファイルを読み込んだ際に全部nullの行や列が入る場合の対応

【NULL】が入ってしまう現象とは?

AlteryxはExcelの読み込みにも対応しているため、データの加工自体はファイル形式を変換せずとも可能です。しかし処理データ以外の内容も含まれている場合、読み込みの際には注意が必要です。

例えば以下のようなExcelデータがあったとします。実際に処理を行いたいデータは黄色で囲った範囲の内容になります。

こちらをこのまま、Alteryxに読み込ませてみましょう。 Excelデータ上で何らかの書式設定が施されている部分は、Alteryxで読み込んだ際に、"そこに何かあるもの"として「NULL」として含まれてしまいます。この状態だと、フィールド名そのものが以下のようにデータ値として表示されてしまうため、次の処理工程へ進む前に「NULL」を削除する必要がでてきます。

こういったExcelデータを読み込む際には、あらかじめデータのみにしておくか、CSVを利用されたほうがスムーズかと思います。

Excelデータをそのまま読み込ませたいとき

Excelにて範囲指定をしておく

Alteryxの仕組みは理解したけれど、こういったデータのまま、どうしてもAlteryxにデータを読み込ませたいといったこともあるでしょう。

その場合は、このようにシートをそのまま読み込ませるのではなく

あらかじめExcel上で、範囲指定をし名前を付けておくと

読み込む際に、こちらを選べば

「NULL」は削除された状態になります。

データクレンジングツールを利用する

データクレンジングツールは、こちらのアイコンのものです。

こちらのツールは、以下のような状態のデータで「NULL」を削除してくれるものになります。

Select Fileds to Cleanseにて、すべてのフィールドにチェックをつけると

「NULL」が削除され、「NULL」のみの列は削除されたことが分かります。Excelの範囲指定の場合データの更新があった際に、範囲指定をやり直す必要がありますが、こちらの場合だとExcelで行や列が増えても、わざわざ範囲指定をし直す必要がありません。

終わりに

Alteryxにて、データの処理を行うにあたっての基本的な概念をお伝えしました。 どなたかのご参考になれば幸いです。