
dbt Coalesce 2025で発表された新情報まとめ
さがらです。
現地時間の2025年10月13日~16日に、dbt Labs社の年次イベントである「Coalesce 2025」が開催されています。
このCoalesce 2025にて多くの新情報が発表されました。dbt Labs社から多くの公式ブログもリリースされていますので、これらの情報を本記事でまとめていきます。
※dbt Platformという言葉が何度も出てきますが、これまでの「dbt Cloud」と同義です。
参考にした情報
公式ブログを中心に、以下の情報を参考にしております。
dbt Labs社とFivetran社の合併&「Open data infrastructure」というビジョンの発表
個人的にも一番衝撃的であったのが、dbt Labs社とFivetran社との合併の発表です。
「この合併によりFivetranとdbtという2つの製品が統合されるのでは?」と感じますが、dbt Labs社の公式ブログに以下のように言及があるため、製品自体の統合の予定はなさそうです。
Right out of the gate, let me just say something basic, but important. dbt will still be dbt. Fivetran will still be Fivetran. We’re not planning to rename either product, not planning any disruptive product changes, we’ll continue to provide the same types of support for the dbt Community, and are aggressively executing against our respective product roadmaps.
合併についての詳細は、両社から出ている公式ブログをご覧ください。
また、この両社の合併に伴い新しいビジョンとして「Open data infrastructure」を発表しました。Modern Data Stackのツールの多さに起因した統合の複雑さ、All-in-oneプラットフォームの高コストやベンダーロックイン、という課題解決に向けたビジョンのようです。
特定のコンピュートエンジンに依存せず、標準規格による連携を重視したデータインフラのことで、統合の手間を省きつつ、コンピュートの選択肢を柔軟にできることがメリットとなります。
Open data infrastructureについての詳細は、以下の公式ブログをご覧ください。
dbt Fusionがdbt Platformでプライベートプレビュー
2025年1月に買収したSDF社の技術を用いた新しいエンジンであるdbt Fusionが、dbt Platformでもプライベートプレビューとなりました。
(リリースノートによると、利用の際は担当のアカウントマネージャーまで問い合わせが必要とのことです。)
dbt Fusionについては私も以前試しており、内容を以下の記事でまとめています。カラムレベルのリネージやDWH/DBにクエリを発行せずにクエリエラーを検知するなど、とても便利な機能ばかりなのでこれがdbt Platform上でも利用できるのは嬉しいですね!
state-aware orchestrationがdbt Platformでプライベートプレビュー
上流のデータが変更されていない場合に下流のModelの更新を自動でスキップしてくれるstate-aware orchestrationがdbt Platformでプライベートプレビューとなりました。(この機能はdbt Fusionの利用が前提ですので、ご注意ください。)
下図は公式ブログからの引用ですが、例えば下図のDAGがあってstate-aware orchestrationを有効化した上でdbt build
を実行すると、src_orders
が更新されていないため、その下流のstg_orders
とint_orders
は更新をスキップする、ということを自動で行ってくれるようになります。
またstate-aware orchestrationの新機能として、updates_on
とbuild_after
という新しいfreshnessのパラメータが追加されています。(公式Doc)
updates_on
:あるモデルが依存している上流のモデル(親モデル)が複数ある場合に、どのタイミングでそのモデルをビルドするかを決定する設定any
:依存している上流のモデルのうち、どれか1つでも新しいデータであればこのモデルをビルドする ※デフォルトall
:依存している上流のモデルすべてが新しいデータで更新されるまでこのモデルのビルドを待つ
build_after
:ソースデータが更新されていようと、前回のModel更新から指定した時間だけ経過してから更新するようにできる設定
Modelレベルのプロパティとして設定可能です。(以下はdbt_project.yml
での例)
models:
+freshness:
build_after:
count: 1
period: day
updates_on: any
また、テストについてもcolumn-awareとaggregated testingという機能が追加されています。こちらの機能は、上流と下流で全く同じカラムに対してテストが行われている場合、上流で一度テストを行ったら下流ではテストを行わない、ということが出来る機能です。
dbt Insightsが一般提供
dbtの中でアドホックにクエリを書いて簡単なグラフ作成まで行えるdbt Insightsが一般提供となりました。
dbt Insightsの新機能として、Query Builderという機能がBeta版としてリリースされています。この機能は、SQLを書かずにSemantic Layerに対するクエリを作成できる機能です。
dbt Insightsについては以下の記事も参考になると思います。こちらも併せてご覧ください。
MCP Server関係のアップデート
MCP Serverについて、以下のアップデートがありました。
- Local MCP Serverが認証方式としてOAuthをサポートするように
- dbt Platformに対して接続できるRemote MCP Serverが一般提供
Remote MCP Serverについては以下の記事も参考になると思います。こちらも併せてご覧ください。
dbt Agentsの発表
dbt Platform上で動作するエージェント機能として、dbt Agentsが発表されました。
具体的には以下4つのエージェントについて言及がありました。(画像は公式ブログから引用)
- Analyst agent(ベータ版として提供)
- dbt Insights上で利用できる、自然言語で問い合わせてクエリの生成と実行を行ってくれる機能。dbt Semantic LayerでMetricsが定義されている場合はそちらを使い、Metricsがない場合は推論してクエリを生成する
-
Discovery agent(ベータ版として提供)
- 欲しいModelやMetricsの情報を、自然言語で検索できる機能
-
Observability agent(近日公開予定)
- ジョブの監視、考えられる根本原因の特定、解決時間の短縮を支援する機能
-
Developer agent(近日公開予定)
- Modelのロジックの説明、下流への影響の予測、重複したロジックのフラグ付け、マージ前の変更検証などを行える機能。VS Codeとdbt Studioどちらでも利用可能となる予定
- 公式ブログのGifでは、ストアドプロシージャのコードからdbt用のSELECT文を作成している例が載っていました
MetricFlowのオープンソース化を発表
dbt Semantic Layerを支えるコア技術であるMetricFlowをオープンソース化したことを発表しました。
MetricFlowはApache 2.0ライセンスの下で公開され、今後はSnowflakeやSalesforceといったパートナー企業と共に、Open Semantic Interchange (OSI)の目標と連携しながら開発が進められます。これにより、業界全体でセマンティック定義の相互運用性を高め、ベンダーロックインを防ぐことを目指しています。
最後に
dbt Coalesce 2025で発表された新情報について、まとめてみました。
個人的にはdbt Platform側の機能強化が多くて嬉しかったですね。これらの機能が一般提供となる日が待ち遠しいです!