GoogleスプレッドシートをFivetranでデータウェアハウスに同期する方法

2021.09.24

すっかり季節は秋に突入です。
こんにちは。
データアナリティクス事業本部ビジネスソリューション部BIチームのshoです。

今回は、FivetranのGoogle Sheetコネクターついてご紹介していきたいと思います。
Fivetranは、データ連携を自動化できるサービスになります。

SalesforceやGoogle Analyticsなどの170以上のデータソースからデータを抽出、ロード、変換(いわゆるELT処理)を実施することが可能です。 ファイルを取り込むこともでき、Google Sheetコネクターがその手法のひとつです。

データの同期先には以下が挙げられます。

  • Azure Synapse
  • BigQuery
  • Databricks
  • MySQL(ベータ版)
  • Panoply
  • Periscope
  • PostgreSQL
  • Redshift
  • Snowflake
  • SQL Server

事前準備

Googleのスプレッドシートを同期するにあたっては、対象のデータを【名前つき範囲】として保存しておく必要があります。

  1. 対象のGoogleスプレッドシートを開く
  2. メニューバーの[データ]より[名前付き範囲]を選択

  3. 右に表示された設定画面より[+]を選択

  4. 名前付き範囲の名称、対象の範囲を指定し、[完了]を選択

これにて事前準備は完了です。
ここから早速コネクターを追加していきます。

Eメールコネクターを追加する

Fivetranのダッシュボードからコネクタータブにアクセスし、右上の“ADD CONNECTOR”をクリックします。

コネクターの中からGoogle Sheetを選択します。

セットアップ画面が起動するので、任意のテーブル名称、スキーマ名称を入力します。

データを同期するための共有Eメールアドレスが表示されているので、Googleスプレッドシートを開き、閲覧者として追加します。

GoogleスプレッドシートのURLを入力し、上記共有作業が完了後、[FIND SHEET]を選択します。

Fivetranが対象のGoogleスプレッドシートを読み込み、名前付き範囲の一覧が確認できるようになります。
一覧から対象の名前付き範囲を指定し、“SAVE & TEST”をクリックします。

対象のGoogleスプレッドシートへの接続テストが開始します。
成功したことが確認出来たら“VIEW CONNECTOR”をクリックし、セットアップが完了します。

最後に、“START INITIAL SYNC”をクリックし、初期同期を開始してください。

初期同期完了後、データ同期先にて使用状況が確認できるようになります。

添付されたファイル内のデータ項目のほかに、以下の項目がテーブルには保存されます。

  • 行番号
  • Fivetranの同期時刻

まとめ

今回は、FivetranのGoogle Sheetコネクターについてご紹介しました。
Googleスプレッドシートにてデータを保存しているものがあれば、ぜひご活用ください。