CSA Data Uploaderの入力ファイルとして『zip圧縮』を選択出来るようになりました

2021.05.28

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

クラスメソッドが展開しているデータ統合基盤サービス『CSアナリティクス』(以降"CSA")のプロダクト群の1つ「CSA Data Uploader」では、お客様の基幹システムなどのオンプレにあるデータをAWSやGCPといったクラウド環境へアップロードする一連の作業を簡単・スムーズに実行できます。

先日リリースした最新バージョン「v1.10.0」では、ファイルの入力データソース指定時に、ファイルの形式の選択肢として「zip圧縮」が選択可能になりました。当エントリではその機能について紹介します。

利用可能なファイル形式

zip圧縮形式のファイルは以下の「入力」データソースで選択可能です。

  • S3
  • GCS
  • SFTP
  • ローカル

使い方

基本的な使い方としてはzipファイルを以下の形式で指定、選択可能です。

  • 単一ファイル指定

  • 複数ファイル選択

ここでは複数zipファイルを処理させる場合の実践例を紹介します。下記のような形でzipファイルを用意。

(※ちなみに、今回準備した環境はWindows Subsystem for LinuxのUbuntuを使ったパス構成となっています。)

CSA Data Uploaderの入力データソース指定画面で、任意のフォルダにzipファイルを配置し、フォルダ指定(またはワイルドカード指定)を行ってください。下記はフォルダ指定の例です。

ちなみに、zip以外のファイルが混在していた場合、この操作をするとエラーになります。上記構成フォルダ配下にzipファイル以外のファイルを追加した上で、

zipファイル指定を行い、後続ジョブを作成後実行すると、以下のようなエラーが表示されます。

まとめ

データアップローダでは入力ファイルに複数なファイル拡張子からデータを取得できます。データソースは圧縮なしやgzip圧縮を選択できます。新しいv1.10.0で入力にzip圧縮も選択できるようになりました。

CSA Data Uploaderは1ヶ月間のトライアル利用が可能となっています。興味をお持ち頂いた方は是非無料版ダウンロードページからインストーラを入手頂き、お試し頂けますと幸いです。