![[登壇レポート]Apache Icebergと超えていくデータレイクの限界 -S3とSnowflake活用事例-でSnowflake×Icebergの機能と活用例についてお話しました #datalake_findy](https://devio2024-media.developers.io/image/upload/v1740694419/user-gen-eyecatch/cr4dcswxoorax9tfocrs.png)
[登壇レポート]Apache Icebergと超えていくデータレイクの限界 -S3とSnowflake活用事例-でSnowflake×Icebergの機能と活用例についてお話しました #datalake_findy
さがらです。
2025年2月28日にFindy社主催で「Apache Icebergと超えていくデータレイクの限界 -S3とSnowflake活用事例-」というイベントが開催されました。
このイベントの中で、「Snowflakeの開発・運用コストをApache Icebergで効率化しよう!~機能と活用例のご紹介~」というセッションタイトルで登壇をしてきましたので、その本記事では登壇資料と登壇を終えての所感についてまとめます。
登壇資料
登壇資料上の各リンク集
-
Icebergテーブル ※「外部のカタログ」利用 (スライド7)
-
Icebergテーブル ※「Snowflakeのカタログ」利用 (スライド8)
-
Snowflake Open Catalog (スライド9)
-
Snowflake Open Catalogの「内部」と「外部」の違い (スライド10)
-
Snowflake Open Catalogの「内部」と「外部」の使い分け (スライド11-12)
-
余談:Snowflake Open Catalogに対する期待 (スライド14)
-
データロード:Amazon Data FirehoseのIceberg形式での配信機能 (スライド17)
-
データロード:FivetranのS3をDestinationとしたデータ連携 (スライド18)
-
データロード:BigQueryで出力したIcebergをSnowflakeでクエリ (スライド19)
-
データ活用:DatabricksからSnowflakeのIcebergテーブルを参照 (スライド20)
-
データ活用:BigQueryからSnowflakeのIcebergテーブルを参照 (スライド21)
-
データ活用:DuckDBからSnowflakeのIcebergテーブルを参照 (スライド22)
登壇を終えて
まず、450名を超えるイベント登録を頂き、多くの方にご参加頂けたことがとても嬉しいです!ご参加頂いた皆様、本当にありがとうございました。
SnowflakeのIceberg機能としてIcebergテーブルがあり、そのIcebergテーブルは「外部カタログ」と「Snowflakeのカタログ」利用で仕様が異なり、更にSnowflakeはSnowflake Open Catalog(Apache PolarisのSaaS版)も提供しておりカタログの仕様が「内部」と「外部」で異なる…という、初見だと正直理解までに時間がかかる所だと思います…
一方で、このSnowflakeのIceberg機能の仕様を理解しておくことで、データロード・データ活用、それぞれの観点で上手くIcebergを活用できれば、開発・運用コストの大幅な効率化が期待できる分野だとも考えています。(各活用例については登壇資料を見て頂けると嬉しいです!)
今後も各製品からアップデートが見込まれますので、私も最新情報を引き続きキャッチアップして情報発信していけたらと考えています!