[2025年10月29日号]個人的に気になったModern Data Stack情報まとめ
さがらです。
Modern Data Stack関連のコンサルタントをしている私ですが、Modern Data Stack界隈は日々多くの情報が発信されております。
そんな多くの情報が発信されている中、この2週間ほどの間で私が気になったModern Data Stack関連の情報を本記事でまとめてみます。
※注意事項:記述している製品のすべての最新情報を網羅しているわけではありません。私の独断と偏見で気になった情報のみ記載しております。
Data Extract/Load
Airbyte
新しい販売プランとして「Plus」が追加
AirbyteのSaaS版において、新しい販売プランとして「Plus」が追加されました。
これまでSaaS版の最廉価プランはStandardプランがあったのですが、今回追加されたPlusはStandardと同一の機能でありながら、「年間請求 (annual billing)」と「Accelerated supportを提供」することが差別点となっているようです。
Data Warehouse/Data Lakehouse
Snowflake
SnowflakeがPalantirとの戦略的パートナーシップを発表
SnowflakeとPalantir Technologies Inc.が、新たな戦略的パートナーシップを発表しました。
Snowflakeと、PalantirのPalantir Foundry(民間企業向けのデータ統合・モデリング・業務改善プラットフォーム)およびPalantir Artificial Intelligence Platform(企業固有データを使ったAIアプリケーション開発を支えるためのプラットフォーム) を統合するパートナーシップであると、以下のリリースで言及があります。
AWSにおけるクロスリージョンのPrivateLinkのサポートが一般提供
AWSにおいて、クロスリージョンのPrivateLinkのサポートが一般提供となりました。
Snowflakeが提供するMCP Serverについて
@makotyo__さんにより、Snowflakeが公式に提供するMCP Serverは現在Managed版とOSS版の2種類があり、その違いについてまとめられた記事が出ていました。
Snowflakeの提供するMCP ServerはCortex AnalystとCortex Searchしか接続できないと私も勘違いしていたのですが、OSS版の場合はCortex Agents、Semantic Viewへのクエリ、オブジェクトの作成・削除・更新、SQL実行など、Managed版よりも多くの機能を提供していると知ることができ、大変参考になりました。
(一方で懸念点として、OSS版はSnowflake-Labsという実験的なOSSなどを管理するアカウントの中で管理されているため、こちらがsnowflakedbに移行してくれるとより安心して使うことができると感じました。Managed版の機能アップデートも含め期待したいところです!)
BigQuery
Data Transfer Serviceの対応サービスが追加
Data Transfer Serviceが新しく、以下の4つのデータソースからのデータ転送に対応しました。
- Facebook Ads
- Salesforce
- Salesforce Marketing Cloud
- ServiceNow
Managed AI functionsがプレビュー
BigQueryの新機能として、SQLベースでGeminiを用いた各処理を行えるManaged AI functionsがプレビューとなりました。
以下の3つの関数がプレビューとなっています。
- AI.IF: プロンプトに基づき、テキストやマルチモーダルデータをフィルタリング
- AI.SCORE: プロンプトに基づいて入力を評価し、品質や類似性などでランク付け
- AI.CLASSIFY: テキストをユーザー定義のカテゴリに分類
Databricks
ソーステーブル更新時にジョブをトリガーできるように
Databricksの新機能として、ソーステーブル更新時にジョブをトリガーできる機能がリリースされました。
ドキュメントを見る限りでは、指定したテーブルすべてが更新されたとき・指定したテーブルの内の一部が更新されたとき、など柔軟にトリガーを設定できるようです。
Python Data Source APIの一般提供
PySparkの「Data Source API」が一般提供となったことに併せ、Databricksの公式ブログからこの機能がどのように使えるかを紹介するブログが出ていました。(この機能はApache Spark 4.0(Databricks Runtime 15.4 LTS以降)で利用可能です。)
このAPIにより、開発者は純粋なPythonを使用してSpark用のカスタムデータコネクタを構築できるようになり、REST API、HuggingFaceデータセット、独自システムといったSparkネイティブでないデータソースとの統合を簡素化することが出来ます。
MotherDuck/DuckDB
メタデータ管理用のDuckDBファイルもS3などのストレージ上で管理するDuckLakeの活用方法
DuckLakeの公式ブログより、データベースサーバーを必要としない、読み取り専用のサーバーレスデータレイクアーキテクチャ「Frozen DuckLake」の構築方法について紹介する記事が公開されました。
Frozen DuckLakeは、クラウドストレージ(AWS S3など)上のParquetファイル群を参照する、読み取り専用のDuckDBデータベースファイル(.ducklakeファイル)を利用するアプローチです。このDuckDBデータベースファイルをクラウドストレージに配置・公開するだけで、利用者はHTTP経由で直接SQLアクセスが可能になる、という仕様となっています。
Business Intelligence
Tableau
Tableau 2025.3がまもなくリリース
Tableau 2025.3がまもなくリリースされるため、Coming soonのページが更新されていました。
個人的には「Prep: In-Database Processing」が楽しみですね!
Omni
Explo社の買収を発表
Omniがembedded analyticsに強みを持つExplo社を買収したことを発表しました。
この記事では過去1年のOmniの実績についても以下のように言及がありました。調子が良さそうですね!
- ICONIQが主導する シリーズBの資金調達
- 2024年に10倍の成長を達成し、2025年には4倍の成長ペースで、年末までにARR3,000万ドルに到達する予定です。
- アジア太平洋地域での新規事業を含む国際展開
- Cribl、dbt Labs、Guitar Center、Hightouchなど、数百の新規顧客を獲得しました。
- MCP サーバー、Agentic Analytics、新しいスプレッドシート機能 のリリースなど、毎週製品機能をリリースしました。
Data Catalog
OpenMetadata
OpenMetadata 1.10のリリース
OpenMetadataの最新バージョンとして1.10がリリースされました。
リネージを元にしたImpact Analysis、Data Contractsの改善、などが主要なアップデート内容だと思います。
Data Activation (Reverse ETL)
Census
terraform-provider-censusがリリース
CensusのSource、Dataset、Destination、Sync、WorkspaceをTerraformで管理できる、terraform-provider-censusがリリースされました。






