[2026年6月24日号]個人的に気になったModern Data Stack情報まとめ
さがらです。
Modern Data Stack関連のコンサルタントをしている私ですが、Modern Data Stack界隈は日々多くの情報が発信されております。
そんな多くの情報が発信されている中、この4週間ほどの間で私が気になったModern Data Stack関連の情報を本記事でまとめてみます。
※注意事項:記述している製品のすべての最新情報を網羅しているわけではありません。私の独断と偏見で気になった情報のみ記載しております。
Modern Data Stack全般
Fivetran + dbt Labs合併完了
2026年6月1日、FivetranとdbtLabsの合併が正式に完了しました。2025年10月に発表された全株式交換による合併で、データエンジニアリング界における最大規模の統合の一つです。
合併後もGeorge Fraser(元Fivetran CEO)がCEO、Tristan Handy(元dbt Labs CEO)がPresidentとして両社のリーダーシップを継続します。合計で100,000以上のデータチームを支援し、OpenAI・Zendesk・HubSpotなどのグローバル企業が顧客となります。
Data Warehouse/Data Lakehouse
Snowflake
Snowflake Summit 2026(6月1〜4日、Moscone Center)にて、多数の新機能・新製品が発表されました。(以下、発表された目玉と言える機能についてまとめます。)
弊社でもKeynoteのレポートブログを書いていますので、ぜひあわせてご覧ください。
Snowflake CoWork・CoCo正式発表
Summitで最も注目を集めたのが製品のリブランドと新機能の発表です。
- Snowflake Intelligence → Snowflake CoWork:ビジネスユーザー向けAIコワーカー。自然言語でSnowflakeのデータを活用でき、iOSアプリや財務・営業チーム向けプリビルドプラグインも提供予定。
- Cortex Code → Snowflake CoCo:コーディングエージェント。2026年2月のリリースからわずか数ヶ月でSnowflake史上最速成長を記録し、7,100以上のアカウントが利用中。
CoWorkには以下の新機能が追加されています。
- Personal Work Engine:ユーザーごとのメモリ機能・個人用スキル・MCPコネクタ対応
- Cortex Sense:実行時にエージェントを自動強化する機能。精度83%向上を報告
- Cortex Agent Sharing(パブリックプレビュー):エージェントを複数アカウント間でデプロイ可能に
CoCoにはCoCo for Desktop(GA)、Excelプラグイン、Code Bundles(Python/Javaの直接デプロイ)が追加されています。
Snowflake Datastreamがプライベートプレビュー
Kafka互換のフルマネージドストリーミングサービス「Snowflake Datastream」がプライベートプレビューとなりました。
- ゼロコピー・ストリーミングによるサブ秒レイテンシ
- 既存のKafkaクライアントとの互換性を保ち、移行コストを最小化
- Snowflakeのストレージ・コンピュート分離アーキテクチャを維持
Natoma買収(MCP戦略)
Snowflakeが、エンタープライズMCPプラットフォームのNatomaの買収を発表しました。
NatomaはMCP(Model Context Protocol)を通じて、Google Drive・Gmail・Zoom・Jira・Slackなど100以上のビジネスシステムへの安全な接続を提供するプラットフォームです。買収後はSnowflakeのCoWorkやCoCoに統合され、エンタープライズデータへのエージェントアクセスを包括的に実現する見込みです。なお、すべての接続はSnowflakeのセキュリティ・ガバナンス基盤を通じて管理されます。
エージェントが社内のあらゆるデータシステムに安全にアクセスできる「コントロールプレーン」を構築する狙いを感じます。
Adaptive Compute 一般提供(GA)
2026年6月16日、SnowflakeのAdaptive Computeが一般提供(GA)となりました。クエリの特性に応じてコンピュートリソースを自動調整するウェアハウスで、新規作成または既存ウェアハウスからダウンタイムなしで変換可能です。
- AWS上の6リージョン(米国・欧州・アジア太平洋の各2拠点)で利用可能
MAX_QUERY_PERFORMANCE_LEVELとQUERY_THROUGHPUT_MULTIPLIERの2パラメータのみで設定可能
弊社でもプレビュー期間中に実際に検証した記事を公開しています。
Zennにおいても実際の混合負荷環境での検証記事が公開されており、コスト指数23%低下・SELECT p99実行時間89%短縮という結果が報告されています。特に自由分析系(軽重混在クエリ)での効果が顕著で、パイプライン・BI系では標準ウェアハウスに戻すという判断も合理的と示しています。
Horizon Context
Snowflake Summit 2026ではHorizon Contextも発表されました。Horizon Catalogがガバナンス・セキュリティに特化するのに対し、Horizon ContextはAIエージェント・BI・アプリケーション向けの「統治されたコンテキストレイヤー」として機能します。
3段階の仕組みで動作します:
- PostgreSQL・SQL Server・Tableau・Power BI・dbtなど外部システムからメタデータを自動抽出
- カラムレベル系統情報・人気度分析・AI生成ドキュメント・セマンティックビューで意味付加
- コンテキスト検索と自動セマンティックビュー検出
「定義は一度だけ管理され、どこでも使用される」という設計で、メトリクス定義が分散してしまう問題を解決します。CoWorkやCoCo、外部AIエージェントがSnowflakeのデータを正確に理解するための文脈を保持する基盤として機能します。
Databricks
Databricks Data + AI Summit 2026(6月15〜18日、Moscone Center)が開催され、多数の新機能が発表されました。(以下、発表された目玉と言える機能についてまとめます。)
LTAP(Lake Transactional/Analytical Processing)
DatabricksがLTAP(Lake Transactional/Analytical Processing)を発表しました。OLTPとOLAPを単一のレイク上で統合するという新しいデータ処理アーキテクチャです。
- Lakebase(Postgres on オープンオブジェクトストレージ)とLakehouseを共通のストレージレイヤー・ガバナンスモデルで統合
- ETLパイプライン・レプリカ・コネクタが不要になる設計。「データ移動がないため結果は常に同期」
- Unity Catalogを通じた統一ガバナンス
- ステータス:Coming Soon(Lakebaseの一部として提供予定)
SnowflakeのHybrid TablesやSnowflake Postgresとも競合しますが、Databricksはオープンフォーマット(Delta Lake)上での実現を目指している点が差別化ポイントです。プロダクトとして利用できるのはまだ先ですが、Lakehouse上のデータ基盤の将来像として非常に刺さりました。
Genie One・Genie Ontology・Genie Agents
DatabricksがGenie Oneを発表しました。従来のGenie Spaces(Q&A型の分析)から進化した、エージェント型のAIコワーカーです。
- Genie One:Web・iOS・Android・Slack・Teams対応。非構造化データへの推論、ドキュメント作成、スケジュール実行が可能
- Genie Ontology:すべてのGenieプロダクトを支える自己改善型のナレッジグラフ。会話履歴から自動的に知識を蓄積
- Genie Agents:Genie Spacesの会話をエージェントとして保存・共有可能に。記憶・情報源・指示・振る舞いを継承
併せて、Genie製品群は2026年7月6日よりPay-as-you-goへ移行となります。(ユーザーあたり月150 DBU無料、約$10.50相当)
Lakehouse//RT(Reydenエンジン)
DatabricksがLakehouse向けのリアルタイム分析エンジン「Lakehouse//RT」をベータ発表しました。
- 新しい「Reyden」エンジンを搭載し、サブ100msのレイテンシを実現
- 高コンカレンシー環境でも低レイテンシを維持
- AI/BI Dashboardのバックエンドとして活用
- Zerobus(フルマネージドのサーバーレス取り込みAPI)と組み合わせて、Deltaテーブルへのストリーミングも実現
OpenSharing(Delta SharingのAIアセット拡張)
DatabricksがOpenSharingを発表しました。Delta Sharingをデータ共有にとどまらず、AIアセット(エージェントスキル・モデルなど)の共有にも拡張するオープンプロトコルです。
- データ・モデル・エージェントを任意のクラウド・ベンダー・フォーマットをまたいで共有可能
- Linux FoundationプロジェクトとしてOSSで公開
- Genie Agent Sharing(Beta):ナチュラルランゲージのチャット体験を外部パートナーと共有可能
「AIアセットのオープンな共有標準」を先に取りに来た動きです。Snowflake側もCortex Agent Sharingを発表しており、エージェントの共有の動きが拡大しています。
Omnigent - AIエージェント統合メタハーネス
DatabricksがOmnigentを発表しました。Claude Code・Codex・Cursorなど複数のAIエージェントを統一管理するオープンソースの「メタハーネス」プラットフォームです。
- YAML設定でエージェントやモデルを定義・切り替え可能
- ステートフルなセキュリティポリシーによるアクション追跡
- URLベースのセッション共有・リアルタイムコラボレーション
- コスト管理ポリシーによるトークン消費コントロール
- Databricksサンドボックスでのセキュアな協調作業
- Foundation Model APIs・AI Gatewayを通じたモデルアクセス
- Apache 2.0ライセンスで公開(現在ベータ版)
複数AIエージェントを組み合わせて使うケースが増えてきた昨今、OmnigentはそのコントロールプレーンをYAMLで一元化するアプローチです。「どのエージェントを使うか」よりも「何を達成したいか」に集中できる設計思想が印象的で、データエンジニアリングのエージェント活用という観点でも注目しています。
Free Editionへの機能追加
Free Editionへの機能追加も発表されました。50万人以上が利用するFree EditionにGenie Code・Serverless GPU・Lakebase(PostgreSQL互換DB)・Agent Bricks(AIエージェント構築フレームワーク)・Lakeflow Designerが無料で利用可能になりました。
Genie ZeroOps
DatabricksがバックグラウンドAI運用エージェント「Genie ZeroOps」を発表しました(プライベートプレビュー予定)。データパイプラインや機械学習モデルの運用を自律的に監視・修正するエージェントです。
- パイプライン・ジョブ・テーブル・MLモデルを継続的に監視
- 障害の検出・根本原因分析・修正提案・検証を自動実行
- Unity Catalogによる完全データ系統追跡
- サンドボックスで修正を検証してから本番適用する安全設計
単純なアラート通知から「自動修正まで行うエージェント」への進化であり、今後のデータエンジニアリングの在り方を変えるかもしれない発表として注目しています。
CustomerLake - Agentic CDP
DatabricksがLakehouseに組み込む顧客データプラットフォーム「CustomerLake」を発表しました。
3原則で設計されています:
- Embedded:データ複製なしに既存のガバナンス基盤(Unity Catalog)内で直接実行
- Democratized:マーケターがエージェントインターフェースで信頼できるデータにアクセス
- Autonomous:Profile AgentsとCampaign Agentsが継続的に顧客分析・施策最適化を自律実行
従来の静的バッチキャンペーンから「Infinity Campaigns(継続的1対1パーソナライゼーション)」への移行を実現する狙いです。
Google Cloud / BigQuery
Open Knowledge Format(OKF)
GoogleがAIシステム向けの知識共有フォーマット「Open Knowledge Format(OKF)」を発表しました。
YAMLフロントマター付きのMarkdownファイルとディレクトリ構造で知識を表現する、ベンダー中立のオープン標準です。typeフィールドのみ必須というシンプル設計で、テーブル定義・メトリクス・ランブックなどを統一フォーマットで管理できます。
BigQueryデータセット向けのエージェント・静的HTMLビジュアライザー・GA4などのサンプルバンドルがGitHubで公開されています。
弊社でもv0.1の実装解説記事を公開しています。こちらも併せてご覧ください。
BigQuery pipelines トリガーベーススケジューリング(プレビュー)
BigQuery pipelinesに「トリガーベーススケジューリング」機能がプレビューで追加されました。特定のBigQueryテーブルの更新を監視し、変更を検知したタイミングでパイプラインを自動実行する機能です。
- 「全テーブル更新時」または「いずれかのテーブル更新時」を条件として選択可能
- 監視間隔は3分ごと(ポーリングによりAPIコール消費あり)
- 従来の時間ベーススケジューリングとの選択式で利用可能
従来は時間ベースのスケジューリングのみでしたが、アップストリームデータが更新されたタイミングで即座にパイプラインを動かす設計が可能になります。
Data Transform
dbt
dbt Core v2.0 Alpha発表とFusion engineのOSS化
dbt LabsがdbtのCore v2.0 alphaを発表しました。最大のトピックは、Core v2.0の発表だけでなく、Fusion engine(Rust製の高速エンジン)もApache 2.0ライセンスでオープンソース化されたことです。
- エンジン統合:FusionとCore v1(Python)の2エンジンを単一のRust基盤に統合予定
- 全コードをApache 2.0で公開
- v1.12(5月リリース)の主な新機能:
latest_version_pointer:モデルの最新版を自動参照するビューを自動作成vars.yml:プロジェクト変数を専用ファイルで管理(5年以上の要望に対応)on_error:エラー時のダウンストリーム動作を制御- UDF Deferral対応(UDFに依存するモデルを現在のターゲットでビルドせずに実行可能)
- Python版(v1.12.x)は引き続き
1.latestブランチで保守継続 - 現状はアルファ版、コミュニティからのテスト支援を募集中
Snowflake Summit 2026に併せた新機能発表
Snowflake Summit 2026の期間中にも、dbt Labsから複数の新機能が発表されました。
- dbt lint(ベータ版):SQLFluff互換の高性能SQLリンター。既存の
.sqlfluff設定をそのまま利用可能で、SQLFluffより約50倍高速と報告されています - dbt Docs v2(プレビュー):次世代OSSカタログ。コンパクトバイナリインデックスにより大規模プロジェクトでも高速動作し、REST API経由でAIエージェント・MCPサーバーがメタデータをクエリ可能
- dbt State(プレビュー):未変更ノードのスキップ・クローンによるコスト最適化機能($0.094/日の課金モデル)
特にdbt Docs v2のREST APIとMCP対応は、「データカタログをAIエージェントの文脈情報として活用する」という流れと直結しています。SnowflakeのHorizon ContextやDatabricksのGenie Ontologyと同様に、dbtのセマンティックレイヤーもエージェントのナレッジソースとして重要性が高まっています。
Semantic Layer
Cube
MCP Connectorsを発表
CubeがMCP Connectorsを発表しました。Cube AgentがNotion・Linear・Sentry・Attioなどの外部ツールをMCPを通じて活用しながら、データに対する質問に回答できるようになります。数値的な「何か」への回答に「なぜか」の背景情報を組み合わせる設計です。
- ディレクトリコネクタ(検証済み統合)とカスタムコネクタの2形式に対応
- 管理者が組織全体のコネクタ・ツール・利用可能性を統括管理し、既存のアクセス制御ポリシーが継続して適用
- スキルやスケジュール機能との組み合わせで定期的な自動分析も実現可能
Business Intelligence
Sigma
Sigma AgentsがパブリックベータでMCP対応
SigmaがSigma Agentsをパブリックベータとして発表しました。ダッシュボードとアプリにネイティブでエージェント機能を統合する機能です。
主なポイントは以下のとおりです。
- MCP対応:MCPサーバーをSigmaのMCP toolsとして追加可能(SharePoint・Jiraなどサードパーティ連携に対応)
- ウェアハウスエージェント統合:Snowflake Cortex Agents・Databricks Genie Spacesと連携
- 「チャット要素」で自然言語対話が可能。パイプライン分析・財務予測・インシデント要約などのユースケースに対応
Tableau
Tableau 2026.2がリリース
Tableau 2026.2がリリースされました。AI・MCP統合を中心とした機能強化が注目点です。
- Tableau Agent in Dashboards(Beta、7月後半提供予定):ダッシュボード上で自然言語でデータに直接質問可能
- Hosted Tableau MCP(6月末GA):Tableau CloudでMCPがクラウドホスト型に対応。OAuth 2.1対応で自己ホスト不要
- Guided Setup for Tableau Next(GA):管理者向けAI機能有効化の自動セットアップ
- VizQL Data Service Live Dashboard Query:ワークブック背後のデータソースを埋め込みアプリから直接クエリ可能
Hosted Tableau MCPが特に注目です。Tableau Cloudのデータを自己ホストのMCPサーバーを立てることなくエージェントに提供できる仕組みで、Claude・Copilotなどのエージェントからデータを活用できます。
Lightdash
Data Apps
LightdashがData Appsを発表しました。プロンプト入力だけで、セマンティックレイヤー上に動作するカスタムデータアプリケーションを数分で構築できる機能です。
- 全クエリがセマンティックレイヤーを通じて実行され、行レベルのセキュリティとアクセス制御を自動継承
- UI上での直接編集機能を持ち、予測分析ツール・ダッシュボード・レポートなど幅広いユースケースに対応
- 既存のデータガバナンスを損なわずにアプリを構築できる設計
Omni
Dashboard Builder
OmniがAI駆動のDashboard Builderを発表しました。AIエージェント「Blobby」がユーザーの説明・既存チャット・画像をもとにダッシュボードを自動構築します。
- セマンティックレイヤーの権限設定がダッシュボードに自動適用され、閲覧者ごとのデータ制御が維持
- 自然言語での修正指示(「グラフをパイチャートに変更」など)に対応
- ドラフト版での確認後に公開するフローで安全なガバナンスを維持
Data Activation (Reverse ETL)
Hightouch
「Agentic CDP」へ転換 & Series D $150M調達
Hightouchが「The Agentic CDP」を発表し、「Composable CDP」から「Agentic CDP」へのポジショニング転換を宣言しました。あわせてSeries D $150Mの資金調達も完了しました。
Agentic CDPの3つの柱は以下のとおりです。
- 自立実行するエージェントハーネス:マーケターがログインすると、ビジネス目標に紐付いた改善機会のランク付きリストと推奨戦略が自動提示される
- Composable Contextレイヤー:データウェアハウスやブランドシステムにデータをコピーせず接続
- 顧客ごとのガードレール:ブランドルールやコンプライアンス要件に応じたカスタマイズ





