![[2025年8月20日号]個人的に気になったModern Data Stack情報まとめ](https://images.ctfassets.net/ct0aopd36mqt/wp-thumbnail-4c47f61cc8c1b97c00c0efcc68eab01b/ebc4f0c0223a249eae2f9de257dedbcd/eyecatch_moderndatastack_1200_630.jpg)
[2025年8月20日号]個人的に気になったModern Data Stack情報まとめ
さがらです。
Modern Data Stack関連のコンサルタントをしている私ですが、Modern Data Stack界隈は日々多くの情報が発信されております。
そんな多くの情報が発信されている中、この2週間ほどの間で私が気になったModern Data Stack関連の情報を本記事でまとめてみます。
※注意事項:記述している製品のすべての最新情報を網羅しているわけではありません。私の独断と偏見で気になった情報のみ記載しております。
Data Warehouse/Data Lakehouse
Snowflake
データベースのバックアップをACCOUNTADMINでも削除・編集不能に設定した上で取得できる「Snapshot」がパブリックプレビュー
Snowflakeの新機能として、Snapshotがパブリックプレビューになりました。
特徴としては、クローンと同様にゼロコピーでデータを複製できるだけでなく、Retention lockという機能で削除・編集不能なバックアップとして保持できる点です。
実際に私も触ってみてブログにしております、こちらもぜひご覧ください。
生成AIを用いたDescription生成ができるストアドプロシージャ「AI_GENERATE_TABLE_DESC」がパブリックプレビュー
Snowflakeの新機能として、生成AIを用いたDescription生成ができるストアドプロシージャ「AI_GENERATE_TABLE_DESC」がパブリックプレビューとなりました。これまではSnowsight上でボタンをクリックして生成することしかできなかったのですが、これでSQLコマンドベースで生成AIを用いたDescription生成が可能となります。
こちらを実際に私も試してみたブログが以下となります。AI_GENERATE_TABLE_DESCは英語のDescriptionを返すのですが、これをTranslate関数で日本語に翻訳して格納する独自のストアドプロシージャについても書いておりますので、ぜひご覧ください!
Cortex Knowledge Extensionsが一般提供
Snowflakeの新機能として、Cortex Knowledge Extensionsが一般提供となりました。これは、Snowflake Intelligenceなどのエージェント機能から参照できるコンテンツをMarketplaceから取得することができる機能です。実態としてはCortex Search Serviceが組み込まれたデータベースがMarketplaceを介して取得できるようになっています。
実際に私もSnowflake公式ドキュメントのCortex Knowledge Extensionsを使ってSnowflake Intelligenceで試してみましたが、明らかに回答精度が向上していることがわかりました!良いデータがあればAIは良い結果を返すという、好例だと思います。
Workload identity federationが一般提供
Snowflakeが新しい認証の仕組みとして、Workload identity federationをリリースしました。
Workload identity federationを使うことで、AWS IAM、Microsoft Entra ID、Google CloudといったクラウドプロバイダーのIDシステムを使用してSnowflakeに認証するサービス間認証の仕組みを構築することが出来ます。
実際の使い方として、以下のブログが大変参考になります。
今後の展望としては、Snowflakeと連携する際に認証が必要な各SaaS/OSSがWorkload identity federationに対応してくれると、よりセキュアかつ簡単に各ツールとSnowflakeを接続できるようになると思うので、期待したいですね!(例として、以下リンク先のterraform-provider-snowflakeの最新ロードマップを見ると、2025年末までに実装予定のようです。)
Business Critical以上のプランでSnowpipeの課金体系が容量ベースのシンプルなものに変更
8月1日ごろに行われた9.21のリリースで、Business Critical以上のプランの場合Snowpipeの課金体系が容量ベースのシンプルなものに変更となりました。
以前よりも見積は明らかにしやすくなりますし、小さい大量のファイルをロードしたいケースでは新しい課金体系の方が良さそうですね!
詳細は以下の公式情報をご確認ください。
海外の有志による新しいSnowflake MCP Server
海外の有志による、新しいSnowflake MCP Serverがリリースされました。公式のMCP ServerはCortex Agentsを介する仕様となっていますが、こちらはPython Connectorを用いて接続しているため、Snowflakeに対してより広範なリクエストを送ることができる仕様となっています。
Databricks
Unity Catalogにユーザーからデータオブジェクトへのアクセスリクエスト機能が追加(パブリックプレビュー)
DatabricksのUnity Catalogの新機能として、ユーザーからデータオブジェクトへのアクセスリクエスト機能が追加されました。
機能としては、事前にメールアドレスやSlackチャンネルなどを通知先として設定しておくことで、ユーザーからアクセスリクエストがあったときに指定した通知先に連絡が届く、という仕様です。
Unity Catalog REST APIの使い方まとめ記事
Unity Catalogのブログより、Unity Catalog REST APIを使う際のベースラインとなる使い方をまとめた記事が出ていました。
より具体的には、Pythonのrequestsライブラリを使って、CatalogsとTablesを対象に、一覧表示(GET)、作成(POST)、更新(PATCH)、削除(DELETE)といった一般的な操作を具体的なコード例付きで解説しています。
Data Transform
dbt
dbt Fusionと公式のVS Code ExtensionがBetaからPreviewに
これまでBetaとして提供されていたdbt Fusionと公式のVS Code ExtensionがBetaからPreviewになりました。
以下の記事によると、「Fusion conformance」という特定のdbtプロジェクトにおいてFusionがdbt Coreと全く同じパフォーマンスを発揮することを証明するための指標を定義して、この指標が十分な割合のユーザーのdbtプロジェクトにおいて合格しており、これがプレビュー版リリースの自信に繋がったと言及があります。
Business Intelligence
Looker
Looker 25.14のリリースノートが公開
Lookerの最新バージョンである25.14のリリースノートが公開されました。
viewにおいてsynonyms
が定義できるようになったことがとても嬉しいですね!実際の社内の会話では略称などを用いて指標について会話することが多いと思うので、その略称などを同義語で定義しておけば、Conversational Analyticsなどでより実態に伴った自然なやり取りでほしいデータを取得できるようになることが期待できます。
Omni
Omni上でスプレッドシートとほぼ同じ操作でデータ加工集計が行える「Omni spreadsheets」がリリース
Omniの新機能として、Omni上でスプレッドシートとほぼ同じ操作でデータ加工集計が行える「Omni spreadsheets」がリリースされました。
以下のデモを見るとほぼスプレッドシートなので、スプレッドシートでしか作れないリッチな表形式のレポートを作りたい際には良い機能だと思います。一方で懸念点としては、Omniで定義されたSemantic Layerとは別にスプレッドシート上に様々な計算式の指標を使ったデータが蓄積されていくことはリスクとしてあると思います、このあたりを上手く権限などでコントロールできると嬉しいですね!
Omniからdbt exposureをpushできるように
私もChangeLogを見ただけなのですが、Omniの新機能として、dbt exposureをOmniからpushできるようになりました。
これにより、Omniのコンテンツとdbt Modelがどう紐づいているかがexposureとして出力してリネージで見ることができます。
Data Catalog
Select Star
Select Starの8月のリリース情報まとめ
Select StarのChangeLogより、8月のリリース情報についてのまとめが出ていました。
ER図の刷新、MCP Serverのリリースなどが目ぼしいアップデートだと思います。
Data Quality・Data Observability
Elementary
Elementaryの7月のアップデート情報まとめ
Elementaryの公式ブログより、7月のアップデート情報まとめに関する記事が出ていました。
MCP Serverや、異常検出用のトレーニング時に異常データを除外する、という機能が個人的には気になりました。
Data Orchestration
Dagster
MCP Serverをリリース
DagsterがMCP Serverをリリースしました。
以下のブログによると、活用例として、プロジェクトの雛形の作成、dbtやSnowflakeのMCP Serverと連携してのワークフロー構築、といった点が挙がっていました。