「はじめてのdbt活用~DWH内のデータ整備が楽になる!~」を2022年5月30日に再演しました #dbt

2022.05.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

さがらです。

2022年5月30日に、はじめてのdbt活用~DWH内のデータ整備が楽になる!~といったタイトルでウェビナーを開催しました。

こちらは、2022年3月10日に開催した内容の再演でした。

そのため、ウェビナーの詳細と3月開催時の質疑応答の内容は下記の記事を御覧ください。

本記事では、5月30日開催時の質疑応答の内容についてまとめます。

質疑応答

以下、ウェビナー中に口頭で回答した内容も含め、全ての質問への回答を記載しておりますので、御覧ください。

1.作成したmaterialized viewをdbtを使用してrefreshすることは可能ですか?

dbtを使用してREFRESHすることは基本的には不可能です。BigQueryやSnowflakeなどのDWHではmaterialized viewは自動更新が基本だと思いますので、その自動更新の仕様に沿うのがよいと思います。

一方で、RedshiftなどREFRESHコマンド使ってmaterialized viewを手動更新したいケースもあると思います。こちらについて、記述したSELECT文の実行前後に指定したクエリを実行できるhookの機能を使うと、手動更新もできるかもしれません。(こちら検証できておらず恐縮ですが…)

2.documentationで作成したデータカタログのみをデータアナリストなど分析者に向けて公開することは可能でしょうか?

dbt Cloudであれば、Read Only userとしてユーザー招待すればドキュメントだけを公開可能です。

Read Only userが出来ることは下記の記事にもまとめておりますので、参考になると幸いです。

3.airflowなど外部からdbt cloudのdbtコマンドを実行することはできますか?

はい、dbt Cloud専用のOperatorが用意されています。こちらを使用すれば、Airflowを介して、dbt Cloud上でのdbtコマンドを実行可能です。

最後に

dbtに関しては、6月9日にもウェビナーを予定しています!こちらは、dbtだけでなく、FivetranやSnowflakeなど弊社で取り扱いのある他製品とdbtを組み合わせるとどういったことができるのか、という内容を中心にお話します。

ぜひ、こちらにも参加頂けると嬉しいです。