GoogleスプレッドシートをFivetranでデータウェアハウスに同期する方法
すっかり季節は秋に突入です。
こんにちは。
データアナリティクス事業本部ビジネスソリューション部BIチームのshoです。
今回は、FivetranのGoogle Sheetコネクターついてご紹介していきたいと思います。
Fivetranは、データ連携を自動化できるサービスになります。
SalesforceやGoogle Analyticsなどの170以上のデータソースからデータを抽出、ロード、変換(いわゆるELT処理)を実施することが可能です。 ファイルを取り込むこともでき、Google Sheetコネクターがその手法のひとつです。
データの同期先には以下が挙げられます。
- Azure Synapse
- BigQuery
- Databricks
- MySQL(ベータ版)
- Panoply
- Periscope
- PostgreSQL
- Redshift
- Snowflake
- SQL Server
事前準備
Googleのスプレッドシートを同期するにあたっては、対象のデータを【名前つき範囲】として保存しておく必要があります。
これにて事前準備は完了です。
ここから早速コネクターを追加していきます。
Google Sheetsコネクターを追加する
Fivetranのダッシュボードからコネクタータブにアクセスし、右上の“ADD CONNECTOR”をクリックします。
コネクターの中からGoogle Sheetを選択します。
セットアップ画面が起動するので、任意のテーブル名称、スキーマ名称を入力します。
データを同期するための共有Eメールアドレスが表示されているので、Googleスプレッドシートを開き、閲覧者として追加します。
GoogleスプレッドシートのURLを入力し、上記共有作業が完了後、[FIND SHEET]を選択します。
Fivetranが対象のGoogleスプレッドシートを読み込み、名前付き範囲の一覧が確認できるようになります。
一覧から対象の名前付き範囲を指定し、“SAVE & TEST”をクリックします。
対象のGoogleスプレッドシートへの接続テストが開始します。
成功したことが確認出来たら“VIEW CONNECTOR”をクリックし、セットアップが完了します。
最後に、“START INITIAL SYNC”をクリックし、初期同期を開始してください。
初期同期完了後、データ同期先にて使用状況が確認できるようになります。
添付されたファイル内のデータ項目のほかに、以下の項目がテーブルには保存されます。
- 行番号
- Fivetranの同期時刻
まとめ
今回は、FivetranのGoogle Sheetコネクターについてご紹介しました。
Googleスプレッドシートにてデータを保存しているものがあれば、ぜひご活用ください。