[2025年11月12日号]個人的に気になったModern Data Stack情報まとめ

[2025年11月12日号]個人的に気になったModern Data Stack情報まとめ

2025.11.12

さがらです。

Modern Data Stack関連のコンサルタントをしている私ですが、Modern Data Stack界隈は日々多くの情報が発信されております。

そんな多くの情報が発信されている中、この2週間ほどの間で私が気になったModern Data Stack関連の情報を本記事でまとめてみます。

※注意事項:記述している製品のすべての最新情報を網羅しているわけではありません。私の独断と偏見で気になった情報のみ記載しております。

Modern Data Stack全般

4 Senior Data Engineers Answer 10 Top Reddit Questions

MotherDuck社のブログにて、4名のシニアデータエンジニアが、Redditのコミュニティ「r/dataengineering」で最も多く寄せられた10の質問に回答する記事が公開されました。

以下の質問について4人のシニアデータエンジニアからの回答があり、参考になる内容が多いと思います!

  • (面接)もし今日、仕事に応募するとしたら、どのように面接の準備をしますか?
  • (Data Quality)データ品質にどう対処していますか? 誰も投資したがらない中で。
  • (アーキテクチャ)Data LakeやLakehouseが注目される中、Data Warehouseを使い続けることをどう正当化しますか?
  • (Schema変更)「ちょっとしたSchema定義の変更」が既存のETLパイプラインを壊さないように、どう管理していますか?
  • (要求)「Real-TimeでAI駆動のダッシュボードが欲しい」という要求と、時間的制約とのバランスをどう取りますか?
  • (引き継ぎ)最初の作成者が去った後のData Stackを、どのように引き継ぎますか?
  • (スキル)Linuxスキルはどう学びましたか? DEに必要な最低限のスキルは?
  • (Excel)ビジネスサイドからの「ExcelにExportできますか?」という要求にどう対応しますか?
  • (コスト)Cloudコストをどのように節約していますか?
  • (洞察)長年学んだ最も重要な洞察を1つだけ挙げるとすれば何ですか?

https://motherduck.com/blog/data-engineers-answer-10-top-reddit-questions/

Snowflake社によりまとめられたThe Modern Marketing Data Stack 2026が公開

Snowflake社が毎年リリースしているMartech分野に関するレポート「The Modern Marketing Data Stack 2026」が公開されました。

私もざっくりとしか確認できていませんが、スタック全体へのAI/MLの組み込みやAIエージェントの登場によるマーケティングプロセスの自動化についての言及など、AIについての記述が増えていると感じました。

https://www.snowflake.com/en/blog/martech-stack-evolution-ai-privacy/

以下のURLから必要な情報を入力することでダウンロード可能です。

https://www.snowflake.com/en/the-modern-marketing-data-stack-report/

宣伝:Data Engineering Summitで登壇してきました

2025年11月6日に、Findy社主催でData Engineering Summitが開催されました。

https://data-engineering-summit.findy-tools.io/2025

大変ありがたいことに本イベントにSpecial Speaker枠として招待頂き、「激動の2025年、Modern Data Stackの最新技術動向」というタイトルで登壇をしてきました。

以下が登壇レポートへのリンクとなります。2025年の各製品のアップデートをざっくり振り返られる内容となっていますので、ぜひご覧ください!

https://dev.classmethod.jp/articles/data-engineering-summit-modern-data-stack-2025/

Data Warehouse/Data Lakehouse

Snowflake

開発者向けイベントの「BUILD」が開催され、多くの新機能を発表

Snowflakeが毎年11月頃に開催しているBUILDが2025年11月4日~7日に開催されました。

https://www.snowflake.com/en/build/

この中で、多くの新機能が発表されています。

また、リリースノートでも多くの機能が発表されていました。

BigQuery

Data Engineering AgentのPreviewを発表

BigQueryの新機能として「Data Engineering Agent」のPreviewを発表しました。(リリースノートに記載はなく、以下のブログだけが確認できました。)

ブログからの引用ですが、以下のことができるようです。(まとめには生成AIを使用しています。)

  • Pipeline development and maintenance (パイプラインの開発と保守)

    • 自然言語(平易な文章)でのパイプライン作成
    • 既存パイプラインに対する、自然言語でのインテリジェントな修正指示
    • Dataplex Universal Catalogと連携し、ビジネス用語集やデータプロファイルなどのメタデータを自動取得
    • UDFs (User-Defined Functions) を利用した、独自のビジネスロジックやベストプラクティスの組み込み
    • パイプラインのドキュメントとカラム(列)説明の自動生成
  • Data preparation, transformation and modeling (データの準備、変換、モデリング)

    • Google Cloud Storage上の生ファイルに対する、自動的なクリーニング、重複排除、フォーマット標準化
    • Dataplexリポジトリで定義されたルールに基づく、データ品質アサーションの生成
    • PII (Personally Identifiable Information) とフラグ付けされたカラムの自動暗号化
    • Data VaultやStar Schemasといった、複雑なデータモデリングスキーマの生成
  • Pipeline troubleshooting (パイプラインのトラブルシューティング)

    • Gemini Cloud Assistとの統合による問題診断
    • 実行ログの分析による、パイプライン障害の根本原因の特定
    • 障害に対する解決策の提案
  • Pipeline migrations (パイプラインの移行)

    • Dataform環境への移行(既存のデータと変換スクリプトの100%自動複製)
    • レガシーなデータ処理ツールの独自フォーマットや設定を、ネイティブなBigQuery pipelineに変換
    • 既存コードを分析し、最適化されたBigQuery pipelineを生成

https://cloud.google.com/blog/products/data-analytics/exploring-the-data-engineering-agent-in-bigquery?hl=en

Databricks

Databricks MarketplaceでMCP Serverを登録できるように

Databricks MarketplaceでMCP Serverを登録できるようになりました。

これにより、Databricks Marketplaceで公開されたMCP Serverを自社のDatabricks内で気軽に入手し試すことができるようになりました。

https://docs.databricks.com/aws/ja/release-notes/product/2025/november#list-mcp-servers-in-databricks-marketplace-public-preview

https://docs.databricks.com/aws/ja/marketplace/get-started-provider

https://docs.databricks.com/aws/ja/marketplace/get-started-consumer#install-mcp

Databricks内でGeminiが利用できるように

Databricks内で、Googleの生成AIモデルであるGeminiがネイティブに利用可能となったことを発表しました。

Gemini 2.5 ProとGemini 2.5 Flashが利用可能です。

https://www.databricks.com/blog/googles-gemini-models-databricks

https://docs.databricks.com/aws/ja/release-notes/product/2025/october#gemini-25-pro-and-flash-models-now-supported-on-pay-per-token-endpoints

ClickHouseが日本支社を設立

リアルタイム分析を担えるデータウェアハウスやAI/ML基盤を提供するClickHouseが、Japan Cloud社との戦略的パートナーシップを通じて日本法人ClickHouse株式会社を設立したことを発表しました。

https://clickhouse.com/blog/japan-cloud

Business Intelligence

Looker

Looker 25.20のリリースノートが公開

Lookerの最新バージョンである25.20のリリースノートが公開されました。

今回のリリースは細かい修正が多い印象です。

https://cloud.google.com/looker/docs/release-notes#November_05_2025

Hex

HexのAgent機能を拡張するSlack統合機能とMCP Serverを発表

Hexの新機能として、Slack統合機能とMCP Serverを発表しました。

  • Slack統合:Slackチャンネルで「@Hex」とメンションするだけで、Hex Agentにデータに関する質問ができます。AgentがSQLを書き、分析し、結果をスレッド内で直接回答します。
  • MCP Server:Claude Desktop, Claude Code, CursorのようなAIアシスタントや独自の内部ツールからHex Agentに接続し、既存のHexプロジェクトの検索や新規Exploreの開始が可能になります。

https://hex.tech/blog/introducing-agent-in-slack-and-mcp/

Omni

dbtと連携した各機能について

私の記事で恐縮ですが、Omniはdbtと連携した機能を豊富に備えており、最近技術検証を行ってブログを投稿していました。

Omniでdbtの開発環境のデータを参照しながらSemantic Layerの定義変更・ダッシュボード修正が行えるDynamic Schema、ビジネスメタデータの入力がOmniから可能となるdescriptionとexposureのプッシュ機能、について投稿しています。

https://dev.classmethod.jp/articles/omni-dynamic-schema-with-dbt/

https://dev.classmethod.jp/articles/omni-descriptions-exposures-push-to-dbt/

Data Catalog

Atlan

Data Quality Studioが一般提供

Atlanの中でデータ品質をGUIベースの操作で定義できる、Data Quality Studioが一般提供となりました。

https://shipped.atlan.com/data-quality-studio-is-now-generally-available-3NCZHy

以下のドキュメントを見る限りはDatabricksとSnowflakeでネイティブ統合が可能で、各製品のデータ品質管理機能と連携したデータ品質ルールの設定ができるようです。

https://docs.atlan.com/product/capabilities/governance/data-quality

Secoda

DashboardsとAI Analyticsをリリース

Secodaの新機能として、DashboardsとAI Analyticsがリリースされました。

https://docs.secoda.co/changelog#h_3362905029

Dashboards機能を使うと、手動あるいはSecoda AIで下図のようなダッシュボードを作成することができるようです。

2025-11-12_08h57_24

AI Analytics機能を使うと、Secoda AIの利用状況を確認できるようです。

2025-11-12_08h57_45

Select Star

Select Starの最新リリース

Select Starの最新リリースが公開されました。Ask AIのアップデート、OpenLineageとの統合、アセットを開いた際に空白のDescriptionを自動生成、Select StarのSemantic ModelでLookerの定義を取り込み、などのアップデートが行われています。

https://docs.selectstar.com/changelog/nov-4-2025-ask-ai-accuracy-ai-agents-for-governance-and-more

Data Orchestration

Dagster

Dagsterが1.12をリリース

Dagsterが最新バージョンとなる1.12をリリースしました。

折りたたみ可能なサイドバーを導入するなどのUIの変更、Componentsとdg CLIの一般提供、などが主要なアップデートと感じました。

https://dagster.io/blog/dagster-1-12-monster-mash

https://github.com/dagster-io/dagster/releases/tag/1.12.0

Kestra

Kestraが1.1をリリース

Kestraが最新バージョンとなる1.1をリリースしました。

タスクが失敗した際にAIが修正案を提案する機能、GCSやS3などのファイル検出トリガーが新規作成(CREATE)だけでなく更新(UPDATE)にも対応、あたりが個人的には気になりました。

https://kestra.io/blogs/release-1-1

https://github.com/kestra-io/kestra/releases/tag/v1.1.0

この記事をシェアする

FacebookHatena blogX