CSA Data Uploaderの入力ファイルとして『zip圧縮』を選択出来るようになりました
クラスメソッドが展開しているデータ統合基盤サービス『CSアナリティクス』(以降"CSA")のプロダクト群の1つ「CSA Data Uploader」では、お客様の基幹システムなどのオンプレにあるデータをAWSやGCPといったクラウド環境へアップロードする一連の作業を簡単・スムーズに実行できます。
先日リリースした最新バージョン「v1.10.0」では、ファイルの入力データソース指定時に、ファイルの形式の選択肢として「zip圧縮」が選択可能になりました。当エントリではその機能について紹介します。
利用可能なファイル形式
zip圧縮形式のファイルは以下の「入力」データソースで選択可能です。
- S3
- GCS
- SFTP
- ローカル
使い方
基本的な使い方としてはzipファイルを以下の形式で指定、選択可能です。
- 単一ファイル指定
-
複数ファイル選択
ここでは複数zipファイルを処理させる場合の実践例を紹介します。下記のような形でzipファイルを用意。
(※ちなみに、今回準備した環境はWindows Subsystem for LinuxのUbuntuを使ったパス構成となっています。)
CSA Data Uploaderの入力データソース指定画面で、任意のフォルダにzipファイルを配置し、フォルダ指定(またはワイルドカード指定)を行ってください。下記はフォルダ指定の例です。
ちなみに、zip以外のファイルが混在していた場合、この操作をするとエラーになります。上記構成フォルダ配下にzipファイル以外のファイルを追加した上で、
zipファイル指定を行い、後続ジョブを作成後実行すると、以下のようなエラーが表示されます。
まとめ
データアップローダでは入力ファイルに複数なファイル拡張子からデータを取得できます。データソースは圧縮なしやgzip圧縮を選択できます。新しいv1.10.0で入力にzip圧縮も選択できるようになりました。
CSA Data Uploaderは1ヶ月間のトライアル利用が可能となっています。興味をお持ち頂いた方は是非無料版ダウンロードページからインストーラを入手頂き、お試し頂けますと幸いです。