[2026年5月27日号]個人的に気になったModern Data Stack情報まとめ
さがらです。
Modern Data Stack関連のコンサルタントをしている私ですが、Modern Data Stack界隈は日々多くの情報が発信されております。
そんな多くの情報が発信されている中、この2週間ほどの間で私が気になったModern Data Stack関連の情報を本記事でまとめてみます。
※注意事項:記述している製品のすべての最新情報を網羅しているわけではありません。私の独断と偏見で気になった情報のみ記載しております。
Data Extract/Load
Airbyte
Airbyte AgentsがChatGPTで利用可能に
Airbyte AgentのMCPサーバーがOpenAIのアプリマーケットで提供開始され、ChatGPT上からAirbyteに接続するだけで50以上のデータソースへ単一接続でアクセスできるようになりました。
Salesforce・GitHub・Gong・Jiraなどが対象で、Context Storeにより複数システムのデータをミリ秒で横断検索できます。
Data Warehouse/Data Lakehouse
Snowflake
Cortex AI GuardrailsがSnowflake IntelligenceとCortex AgentsでGA
Snowflakeが提供するAI安全機能「Cortex AI Guardrails」の適用範囲が拡張され、これまでCortex Codeにのみ提供されていたプロンプトインジェクション攻撃への保護機能が、Snowflake IntelligenceとCortex Agentsにも適用されGAとなりました。
直接的な攻撃だけでなく、ツール呼び出しに悪意ある指示を埋め込む「間接的なプロンプトインジェクション」も文脈的推論で検出・無効化する点が特徴です。また、アカウント管理者がAI_SETTINGSパラメーター1つで全対象サービスへ一括有効化できるため、運用面でも管理しやすい設計になっています。
SnowflakeのAI機能群(Cortex Code・Cortex Agents・Snowflake Intelligence)が足並みを揃えてセキュリティ統制の傘下に入ったことで、企業での本番利用に向けたハードルが一段下がった印象です。
Cortex AI Function Studioがパブリックプレビュー
非構造化データ・マルチモーダルデータワークフロー向けのAI機能を、自然言語で作成・評価・最適化できる「Cortex AI Function Studio」がパブリックプレビューとなりました。
Snowsight AI Studio(ノーコード)とCortex Code CLI(AIエンジニア向け)の両方から利用でき、テキスト・ドキュメント・画像・音声・動画のマルチモーダルに対応したAI機能を構築できます。
- プロンプト・モデル選択・ワークフロー戦略を自動ベンチマークして最適化する機能を搭載
- 設定可能な評価指標による自動評価ワークフロー
- ノーコードUIとCLIの両方をサポート
弊社でも実際に試した検証記事があります。llama3.1-8bによる注文優先度分類タスクで初期精度0.65から最適化後0.95まで向上した事例など、動作のイメージが掴みやすいです。
Dynamic Tablesに新リフレッシュモードが2つ追加
Dynamic Tablesに関して、2つの新しいリフレッシュモードがパブリックプレビューとして追加されました。
Adaptive Refresh Mode
通常はインクリメンタルリフレッシュで動作し、上流データの変更量が多い場合には自動でフルリフレッシュに切り替わるモードです。フルリフレッシュ後は再びインクリメンタルに戻るため、INSERT OVERWRITEのような一括ロード混在ワークロードでも手動介入不要でコストを最適化できます。
Custom Incremental Mode
標準リフレッシュモードでは対応できない複雑な変換パターン向けに、ユーザー自身がMERGEまたはINSERTロジックを定義して各リフレッシュ時に実行できるモードです。論理削除・Stream + Taskからの移行などがユースケースとして挙げられています。スケジューリング・リトライ・トランザクション保証はSnowflakeが自動管理してくれるため、Stream + Taskで自前管理していた処理をDynamic Tablesに移行する際の選択肢が広がりました。
External Query EngineによるIceberg Tableへの書き込みサポートがGA
Snowflake Horizon Catalog経由で、外部クエリエンジンからSnowflake管理のIcebergテーブルへの書き込みがGAとなりました。
Iceberg RESTプロトコルをサポートする任意の外部エンジン(Apache Sparkなど)が対象で、Iceberg v2/v3テーブルに対応しています。
既存のSnowflakeのユーザー・ロール・ポリシー・認証基盤をそのまま活用できるため、外部エンジンから書き込む場合でもSnowflakeのセキュリティ統制を維持できる点が重要です。
なお、弊社主催のウェビナーとして、Apache Icebergを通じたSnowflakeとDatabricksの連携を「基礎から現在の状況」まで解説した勉強会が2026年5月26日に開催されました。IcebergフォーマットでのCLUSTER BY動作やRESTカタログの進化によるクロスプロダクト連携の実用性など、実践的な内容が紹介されています。
dbt Projects on Snowflakeにdbt Fusionが追加
2026年5月19日に、Snowflake上のdbt Projects機能に複数の大型アップデートが加わりました。中でも注目なのが、Rustで再構築されたdbtの次世代エンジン「dbt Fusion」(2.0.0-preview)が利用可能になった点です。
追加ライセンス・サブスクリプション不要で全ユーザーが利用でき、既存プロジェクトはALTER DBT PROJECTコマンドでFusionに切り替えられます。今回のアップデートには他にも以下の強化が含まれます。
- カラムレベルの系統分析がDAGビジュアライゼーションで強化(各モデルノードで上流・下流の依存関係を追跡可能)
- dbt Core 1.9.4・1.10.15・dbt Fusion 2.0.0-previewのマルチバージョンサポート(プロジェクト単位でバージョンをピン可能)
- Cortex Code CLIとのdbtライフサイクル統合、DAGからの部分実行も追加
dbt FusionはPythonベースのdbt Coreをゼロから書き直したエンジンで、コンパイル速度の大幅向上が期待できます。弊社でも検証記事を公開しています。
Cortex Search Auto Suspendがパブリックプレビュー
Cortex Search Serviceに、クエリ非アクティブ時にサービングコンピュートを自動停止し、次のクエリ受信時に自動復帰する機能が追加されました。
AUTO_SUSPENDパラメータで非アクティブ継続秒数を指定します。最小値は1800秒(30分)で、デフォルトはNULL(無効)です。
- サスペンド対象はサービングコンピュートのみ
- 閾値超過後5分以内にサスペンドが実行される
- 復帰には数分かかるため、初回クエリのレイテンシが増加する点に注意が必要
- 復帰中に同時リクエストが来た場合はHTTP 429エラーが返される
クエリ頻度が低い環境でのCortex Search運用コストを抑えられるのはありがたいアップデートです。弊社でも検証記事を公開しています。
DuckLabs(旧DuckDB Labs)
DuckDB LabsがDuckLabsに改名
DuckDBを開発・提供するDuckDB Labsが、2026年5月27日にDuckLabsへの改名を発表しました。
改名の理由は、同社がDuckDB以外の複数プロジェクトを管理するようになったためです。現在はDuckLakeというLakehouseフォーマットと、Quackというクライアント・サーバープロトコルも手がけており、「DuckDB Labs」という名前では実態に合わなくなったとのことです。今後これらのプロジェクト群は「DuckStack」として位置づけられる見込みです。
- DuckDB・DuckLake・Quackの各プロジェクトは変更なく継続。IPはDuckDB Foundationが引き続き管理
- DuckDBのダウンロード数は現在1日100万件超
- VC資金調達なし、フィーチャー優先化とサポート契約による収益モデルを維持
- オランダ・アムステルダムに30名超の正社員体制
Business Intelligence
Omni
Omni Skills for Cortex Code — OmniトピックをSnowflakeセマンティックビューに自動同期
SnowflakeのCortex Code向けのオープンソーススキルセット「Omni Skills for Cortex Code」が公開されました。
最大の特徴は「リバースシンク」機能で、Omniで定義したトピックをSnowflakeセマンティックビューに変換・同期することで、メトリクス定義を一元管理しながらCortex Analyst・Snowflake Intelligenceなどのダウンストリームエージェントが同じ解釈層を継承できます。なお、同期はOmni → Snowflakeの一方向です。






