[2025年3月19日号]個人的に気になったModern Data Stack情報まとめ

[2025年3月19日号]個人的に気になったModern Data Stack情報まとめ

Clock Icon2025.03.19

さがらです。

Modern Data Stack関連のコンサルタントをしている私ですが、Modern Data Stack界隈は日々多くの情報が発信されております。

そんな多くの情報が発信されている中、この2週間ほどの間で私が気になったModern Data Stack関連の情報を本記事でまとめてみます。

※注意事項:記述している製品のすべての最新情報を網羅しているわけではありません。私の独断と偏見で気になった情報のみ記載しております。

Data Warehouse/Data Lakehouse

全般

Is Apache Iceberg the New Hadoop? Navigating the Complexities of Modern Data Lakehouses

Data Engineering Weeklyより、Apache Icebergについて、実装の課題、エコシステムの観点などからHadoopと比較分析している記事が出ていました。

Icebergはそれ自体では完全なソリューションではなく、効果的に機能するためには周囲のエコシステムが必要であり、このエコシステムには、カタログ、コンピュートエンジン、メンテナンスプロセスが含まれます。Hadoopも同様に広大なエコシステムを持ち、その管理が複雑さの大きな原因であったため、Icebergも同様の課題に直面していると述べられています。

個人的にもこの課題は共感する所があるため、このあたりの運用課題を各ベンダーがどう解決していくのかに期待したいところです。

https://www.dataengineeringweekly.com/p/is-apache-iceberg-the-new-hadoop

Snowflake

v9.7とバンドル2025_02の内容が公開

Snowflakeのリリースノートのページにて、最新バージョンのv9.7とバンドル2025_02の内容が公開されました。

特に以下のアップデートが気になりました。

https://docs.snowflake.com/release-notes/2025/9_07

SnowflakeがAmazon S3 Tablesを参照して外部カタログのIceberg Tableを定義できるように

SnowflakeがAmazon S3 Tablesを参照して外部カタログのIceberg Tableを定義できるようになったことを発表するブログが、SnowflakeのProduct Managerから出ていました。現在はプレビュー機能です。

3月13日にS3 TablesがApache Iceberg REST Catalog APIに対応する機能が公開されたことで、可能になったようです。)

https://medium.com/snowflake/snowflake-integrates-with-amazon-s3-tables-d6cebf5fdcb2

BigQuery

BigQueryのスロット管理によるコスト最適化に関する解説記事

Mediumにおいて、BigQueryのスロット管理によるコスト最適化に関する解説記事が出ていました。

スロット自体やコスト体系の説明から始まり、スロットの管理にはどのような機能があるかなど体系的にまとめられており、参考になりました。

https://medium.com/google-cloud/bigquery-cost-optimization-with-slot-management-e6eb50697265

MotherDuck/DuckDB

DuckDBがApache Iceberg REST Catalogのサポートを発表

DuckDBがApache Iceberg REST Catalogのサポートを発表しました。

これまではストレージ上のメタデータファイルを直接指定する方法でしかDuckDBはIcebergを参照できなかったため、カタログと連携できれば最新のメタデータファイルを取得できますし、個人的にはとても熱い機能です!!

この機能に触れている下記の記事では、S3 Tablesとの連携について述べられています。

https://duckdb.org/2025/03/14/preview-amazon-s3-tables

DuckDBがローカルPC上で実行できるGUIツールである「Local UI」を発表

DuckDBがローカルPC上で実行できるGUIツールである「Local UI」を発表しました。

画像は下記のブログからの引用ですが、Notebookの形式で出力したテーブル・カラムの統計なども得ながらクエリの実行・分析ができるようです。

https://duckdb.org/2025/03/12/duckdb-ui.html

basics

Data Transform

dbt

dbt利用時のGitのブランチ戦略に関する解説記事

dbt Developerブログにおいて、Gitのブランチ戦略をどうするのがよいかまとめた記事が出ていました。

https://docs.getdbt.com/blog/git-branching-strategies-with-dbt

関連して私の記事で恐縮ですが、dbt CloudでDev/QA/Prodの3環境に分けた場合のdbt projectの構成や開発プロセスをまとめた記事を最近投稿していますので、こちらも参考になると幸いです。

https://dev.classmethod.jp/articles/dbt-cloud-dev-qa-prod-environments/

dbtの新エンジンであるminijinjaに関する記事

dbt Developerブログにおいて、dbtの新エンジンはRust実装のminijijaを活用し、プロジェクト解析を劇的に高速化するという内容についてまとめた記事が出ていました。従来のJinjaベースの解析と比較して、特に大規模プロジェクトで30倍以上の速度向上を実現するようです!

https://docs.getdbt.com/blog/faster-project-parsing-with-rust

この詳細は2025年3月19日~20日に開催予定のdbt Developer Dayで説明がされるようです。気になる方はぜひご参加ください。

https://www.getdbt.com/resources/webinars/dbt-developer-day

Business Intelligence

Looker

25.4のリリースノートが公開

Lookerの最新版である25.4のリリースノートが公開されました。

個人的には以下の内容が気になりました。

  • Gemini in Lookerを使うための権限としてgemini_in_lookerロールが追加された
  • Conversational Analyticsを使うために、Studio in Lookerの有効化が不要となる
    • こちらの機能は私もブログを書いていますので、参考になると嬉しいです
  • Snowflakeの接続設定でキーペア認証をサポート

https://cloud.google.com/looker/docs/release-notes

Omni

創業3周年にして、シリーズBで6900万USDの資金調達を実施

創業3周年となるOmniが、シリーズBで6900万USDの資金調達を実施したことを発表しました。

下記は記事からの引用した文の翻訳ですが、評価額6億5000万USDと前年比8倍の成長も凄まじいなと感じます。

お客様に支えていただいたことに感謝し、Omniが ICONIQ Growthが主導し、既存の投資家であるTheory Ventures、First Round Capital、Redpoint Ventures、GV、Snowflake Venturesが参加する6900万ドルのシリーズB資金調達を完了したことを誇りを持ってお知らせします。創業3周年を迎えたこの節目に、当社の評価額は6億5000万ドルとなり、収益と顧客利用の両面で前年比8倍の成長を遂げています。

https://omni.co/blog/omni-series-b-funding

Data Catalog

Atlan

Excelで記述した定義を元にER図を可視化出来るように

Atlanが新機能として、Excelのテンプレートを用いてER図をAtlanに取り込める機能を発表しました。

https://shipped.atlan.com/import-data-modeling-assets-into-atlan-203xo4

dc655c6d67bf7f5499d7be18b7a64167

Select Star

Fivetran統合機能、Tableau統合機能の改善などの新機能をリリース

Select Starが新機能として、Fivetran統合機能、Tableau統合機能の改善などの新機能をリリースしました。

特にTableauに関して、シートとビューを分けて管理することが出来るようになり、どのシートがどのビューにあるかを識別し、リネージも表示できるようになったとのことです。(個人的には、カスタムSQLもリネージに表示できることを知らなかったので、そこが一番の衝撃でした…)

https://docs.selectstar.com/changelog/march-12-2025-fivetran-integration-tableau-updates-and-more

2025-03-19_11h36_28

Data Activation (Reverse ETL)

Census

CensusがIceberg形式でカタログとデータの更新を管理する「Census Store」を発表

Censusの新機能として、CensusがIceberg形式でカタログとデータの更新を管理する「Census Store」を発表しました。

https://www.getcensus.com/blog/why-we-chose-iceberg-as-the-foundation-for-census-store

以下のドキュメントを見る限りでは、Censusが管理するS3バケットを使うことはもちろん、ユーザーが管理するS3バケットにデータを管理することも可能となっています。

https://docs.getcensus.com/misc/data-storage/census-store

Census Storeの活用例として、Snowflakeからクエリする方法もドキュメントして整備されています。

https://docs.getcensus.com/misc/data-storage/census-store/query-census-store-from-snowflake

Census StoreにSaaSのデータをロードするための機能として、「SaaS Datasets」という機能も発表されています。現在はSalesforceとHubSpotに対応しているようです。

https://www.getcensus.com/blog/introducing-census-saas-datasets-connect-transform-and-activate-your-saas-data

FivetranのManaged Data Lake Service然り、製品側がカタログとデータの更新を管理する機能が少しずつ増えてきた印象です。

Data Orchestration

Dagster

「dg CLI」と「Components」を発表

DagsterのOSS版の新機能として、「dg CLI」と「Components」が発表されました。(現在はプレビュー機能)

「dg CLI」はDagsterプロジェクト管理のためのCLIツールであり、「Components」はyamlベースでDagster関係のリソースを定義できる機能、と理解しています。(Compo)

https://github.com/dagster-io/dagster/discussions/28472

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.