Box のデータを Fivetran と Snowflake に連携する方法

2021.02.09

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

(For English, click here)

はじめに:

Fivetran ではクラウドコンピューティングの体験を向上させるために多種なコネクターの提供に取り組んでいます。最近は、Box と連携しベター版の Box コネクターが公開されました。

Box に存在する次のファイル類であれば読み取りは可能です。Separated Value ファイル (例:CSV, TSV, など)、改行で区切れの JSON テキストファイル、JSON Arrays、Avro と Parquet です。

互換性の為に、このファイルに保管するデータのエンコーディングは:UTF-8、UTF-16、もしくは UTF-32 のいずれかで大きいか小さいエンディアンが必要になります。ファイルの最初にバイト順マークが無い場合は UTF-8 エンコーディングは自動的に選ばれます。

Fivetran ユーザーが Box を連携する為に必要な手順はここでご紹介します。

ご利用の方法:

最初は、Fivetran と Snowflake を登録して連携します。詳しくはこちらから確認して下さい。Snowflake 初期セットアップガイド(英語版)

次は、Fivetran の操作画面から Box に登録する為に以下のように “Connector” ボタンを押します。

次の画面より ”Box” 言葉で検索すると現在はベター版である Box コネクターが現れそれにクリックします。

次は、ターゲットのスキーマが必要になり目的とするデータセットの名前を登録する。対象とする Box のフォルダー URL は以下のように入力し、“Authorize” ボタンを押す。

次に現れる画面では Box へのアクセスを承認する。

アクセス許可が承認されるとデータ接続が確立されます。

新たに設立されたこのデータコネクションにクリックするとその詳細が現れます。

“Status” タブではデータの同期に関する情報が確認出来ます。自動的もしくは手動で同期することが出来ます。右上よりメール配信の設定も選べます。ログとスキーマもそれぞれのタブで確認出来ます。

“Setup” タブではフォルダーの情報、作成者、データ同期の頻度、すべてのデータを再同期する機能などがあります。

新規のデータソースを登録した場合は関係者の全ユーザーにメールで通知が届きます。このメール配信の設定も以下のように編集が出来ます。

Snowflake の画面に切り替えて新たなデータベースが確認出来ます。

ここで SQL クエリを実行すればデータの読み込みが完成したことを確認出来ます。

Fivetran は ELT 方法で動きますので、データを抽出しウェアハウスへ一旦保存します、その後は 編集作業行える仕組みです。

まとめ:

現在は Fivetran では Box のコネクターがベター版で公開されており操作に慣れる為に試用で使うと良いです。

Fivetranの導入支援はクラスメソッドにおまかせください

クラスメソッドはFivetranのライセンス販売パートナーです。 FivetranのほかにもAWS、Looker、Alteryx、Tableau、Snowflakeとパートナー契約を結んでおり、それぞれ豊富な導入実績があります。各サービスとFivetranを連携させることで、お客様の環境にあわせた最適な構成をご提案します。