Alteryx2018.4新機能紹介:Gzipファイルからデータの読み込みに対応しました

こんにちは。Alteryxサポートエンジニアとして勉強中のスズです。

日本時間の2018年11月15日、Alteryxのバージョン2018.4がリリースされました。

Alteryx Designerも2018.4で新しい機能が搭載されています。

今回は新機能のGzipファイルのサポートについてご紹介いたします。

Gzipファイルからデータの読み込みに対応しました

1つのファイルからデータの読み込み

まず、Linuxで以下のデータを含むファイルを用意しました。

id, item, price
1, momo, 130
2, negima, 130
3, sunagimo, 130
4, kawa, 130
5, hatsu, 150

このファイルをgzipコマンドで .gz ファイルに圧縮します。このファイルをAlteryxで読み込んでみます。

ファイルの読み込みにはInput Dataツール(In/Out -> Input Data)を使用します。

ワークフローにInput Dataツールを配置し、.gzファイルを選択します。.gzファイル内に含まれるファイルが1つだけの場合、ファイル形式を選択する画面が表示されます。

今回読み込むデータはカンマ区切りになっていますので、 Comma-Delimited Text Files (*.csv) を選択します。

Browseツール(In/Out -> Browse)を接続してワークフローを実行します。Resultsウィンドウにて読み込んだデータを確認できました。

複数のファイルからデータの読み込み

今度はLinuxでtarコマンドを使って、複数のファイルを1つの.gzファイルにまとめて圧縮したファイルを用意しました。

.gzファイルに複数のファイルが含まれている場合、Input Dataツールで.gzファイルを読み込むと、Alteryx上に読み込むファイルとファイル形式を選択する画面が表示されます。

今回用意したデータのうち、yakitoriファイルには以下のデータがあります。こちらは前項で使用したものと同じデータです。

id, item, price
1, momo, 130
2, negima, 130
3, sunagimo, 130
4, kawa, 130
5, hatsu, 150

yakitori_newファイルには以下のデータがあります。

id, item, price
11, naganegi, 200
12, shishitou, 150
13, shitake, 180
14, uzura, 180
15, butabara, 200

Input Dataツールでyakitoriとyakitori_newのファイルを選択します。読み込むデータはカンマ区切りになっていますので、Parse other file as には Comma-Delimited Text Files (*.csv) を選択します。

Browseツールを接続してワークフローを実行、結果を確認します。2つのファイルから読み込んだデータは、1つのデータにまとめられています。ファイル内のフィールドの構成が同じ場合には、複数のファイルをまとめて読み込むことで、1つのデータとしてまとめることができます。

最後に

今回は2018.4の新機能、Gzipファイルからデータの読み込みについてご紹介しました。2018.4の他の新機能についても当ブログでご紹介していきますのでお楽しみに。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400