Alteryx2018.4新機能紹介:Gzipファイルからデータの読み込みに対応しました
こんにちは。Alteryxサポートエンジニアとして勉強中のスズです。
日本時間の2018年11月15日、Alteryxのバージョン2018.4がリリースされました。
Want to know vital usage statistics about your Alteryx Server without downloading the report? With 2018.4, you now see a dashboard the moment you log in so you can identify resource constraints that can impact performance. #AlteryxAnalytics https://t.co/XOeIXhMR3k pic.twitter.com/037kR4ZS4s
— Alteryx (@alteryx) 2018年11月14日
Alteryx Designerも2018.4で新しい機能が搭載されています。
今回は新機能のGzipファイルのサポートについてご紹介いたします。
Gzipファイルからデータの読み込みに対応しました
1つのファイルからデータの読み込み
まず、Linuxで以下のデータを含むファイルを用意しました。
id, item, price 1, momo, 130 2, negima, 130 3, sunagimo, 130 4, kawa, 130 5, hatsu, 150
このファイルをgzipコマンドで .gz ファイルに圧縮します。このファイルをAlteryxで読み込んでみます。
ファイルの読み込みにはInput Dataツール(In/Out -> Input Data)を使用します。
ワークフローにInput Dataツールを配置し、.gzファイルを選択します。.gzファイル内に含まれるファイルが1つだけの場合、ファイル形式を選択する画面が表示されます。
今回読み込むデータはカンマ区切りになっていますので、 Comma-Delimited Text Files (*.csv) を選択します。
Browseツール(In/Out -> Browse)を接続してワークフローを実行します。Resultsウィンドウにて読み込んだデータを確認できました。
複数のファイルからデータの読み込み
今度はLinuxでtarコマンドを使って、複数のファイルを1つの.gzファイルにまとめて圧縮したファイルを用意しました。
.gzファイルに複数のファイルが含まれている場合、Input Dataツールで.gzファイルを読み込むと、Alteryx上に読み込むファイルとファイル形式を選択する画面が表示されます。
今回用意したデータのうち、yakitoriファイルには以下のデータがあります。こちらは前項で使用したものと同じデータです。
id, item, price 1, momo, 130 2, negima, 130 3, sunagimo, 130 4, kawa, 130 5, hatsu, 150
yakitori_newファイルには以下のデータがあります。
id, item, price 11, naganegi, 200 12, shishitou, 150 13, shitake, 180 14, uzura, 180 15, butabara, 200
Input Dataツールでyakitoriとyakitori_newのファイルを選択します。読み込むデータはカンマ区切りになっていますので、Parse other file as には Comma-Delimited Text Files (*.csv) を選択します。
Browseツールを接続してワークフローを実行、結果を確認します。2つのファイルから読み込んだデータは、1つのデータにまとめられています。ファイル内のフィールドの構成が同じ場合には、複数のファイルをまとめて読み込むことで、1つのデータとしてまとめることができます。
最後に
今回は2018.4の新機能、Gzipファイルからデータの読み込みについてご紹介しました。2018.4の他の新機能についても当ブログでご紹介していきますのでお楽しみに。
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。