
Censusで共通利用出来るデータを定義出来る「Datasets」を試してみた
この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。
さがらです。
Censusには、Census内で共通利用できるデータを定義できる「Datasets」という機能があります。
Datasetsを定義すると、DestinationにSyncしたいデータとして使ったり、Segments機能でセグメントを定義する際のベースのデータにすることも出来ます。
Datasetsを定義
実際にDatasetsを定義してみます。
左のメニューから、Datasetsを押します。

右上の+ New Datasetを押します。

どの方法でDatasetsを定義するか決めて、作成するDatasetsの名前をNameに入れます。dbtのModelやLookerやSigmaで集計された結果もDatasetsに定義できますが、今回は一番シンプルなSQLを選択して進めます。

SQLエディターが表示されるので、Sourceから使用するSourceを選択し、右側のエディター欄にクエリを記述します。
クエリを書いたら、画面下のShow previewからクエリの実行結果を確認できます。問題なく記述したクエリが動くことを確認したら、右下のCreate and condigureを押します。


次に、今回作成するDatasetsがどのタイプなのかを選択する必要があります。Person、Eventなどありますが、選択するタイプによって「ユーザーのメールアドレスを持つカラムはどれか」「イベントのタイムスタンプを持つカラムはどれか」など選択する必要があります。


今回は一番シンプルなGenericを選択します。Genericの場合はUnique Idを指定する必要があります。選択したら、右下のCreate datasetを押します。

作成したDatasetsの確認
次に、作成したDatasetsがどのように見えるか、確認していきます。
Overviewタブでは、定義したSQLを確認したり、Descriptionを追加することが出来ます。

Columnsタブでは、各カラムの型を確認したり、PIIをチェックを入れることでカラムの値が表示されないようにしたり、Enumeratedにチェックを入れることでSegmentsを定義する際にフィルタの候補値を出せるようにしたり、ということが可能です。(詳細は公式ドキュメントも併せてご覧ください。)

Previewタブでは、対象のデータをプレビュー表示することが出来ます。

Relationshipsタブでは、別のDatasetsとのリレーションシップを定義することが出来ます。Segmentsを定義する際に複数のDatasetsを紐づけて定義できるようになります。(詳細は公式ドキュメントも併せてご覧ください。)

Syncsタブでは、このDatasetsを用いたSyncの一覧が確認できます。

Segmentsタブでは、このDatasetsを用いたSegmentsの一覧が確認できます。

Activityタブでは、このDatasetsに対するイベントの履歴を見ることが出来ます。

最後に
Censusで共通利用出来るデータを定義出来る「Datasets」を試してみました。
Datasetsとして定義したうえでSyncやSegmentsの設定をすることで、各Datasetsごとの情報をまとめて1箇所で閲覧が出来るので、基本はDatasetsを定義した上でCensusを活用していくのが良さそうと感じました。
一方でSQLを用いてDatasetsを定義するとデータカオスの温床となるリスクがあると感じました。しかし、dbtのModelやLookerのLookをDatasetsとして定義できる機能があるので、これらのツールと紐づけるならばDatasetsを有効に使えると思います!







