
「生成AI「その前」に!マルチクラウド時代の信頼できるデータを支えるSnowflakeメタデータ活用術」というタイトルで登壇させていただきました #devio2025
こんにちは、みかみです。
はじめに
2025/09/12(金)に、ゆがふBizタワー 1F 会議室にて、クラスメソッドのオフライン技術イベント DevelopersIO 2025 OKINAWA を開催させていただきました。
運営や登壇者が体操着&ジャージ姿の今年の DevelopersIO、「コスプレか?」と思うようなユニフォームでしたが、実は「学園祭」というコンセプトを掲げています(普段の業務でもジャージ着ているような体育会系の会社ではないですよーw
ゲスト登壇いただいた丸山様、神谷様にもお付き合いいただきまして、本当にありがとうございました!
登壇内容
Snowflake のメタデータ管理機能(データ品質管理、データリネージ、セマンティックレイヤー)のご紹介と、セマンティックビューのチューニングによる生成AI(Cortex Analyst の自然言語データ問い合わせ)の精度向上について、ご紹介させていただきました。
「Snowflake って何?」な方向けの内容になっております。
登壇資料作成秘話
実は、当初もっとマルチクラウド色を出すつもりでした。「今のご時世(?) Iceberg でしょ?!」と。。
BigQuery の Iceberg テーブル(BigLake テーブル)を Snowflake 側で参照して Cortex AI で活用できないかと試していたのですが、単純なテーブル作成だと BigQuery からのデータ更新が Snowflake 側で認識できず、実運用には難しそうなので、諦めました。。
以下のさがらさんのブログで詳しく解説されています!
じゃあ、逆に Snowflake で作成した Iceberg テーブルを BigQuery で参照して AI活用できない?
と思い、こちらも検証してみましたが、デフォルトでは GCS に出力される snapshot や metadata が格納されるフォルダの名前にドットが含まれるという仕様のようで、BigQuery 側でデータソースとして認識してくれませんでした。。
それならば、外部カタログで Iceberg テーブル作成したら?
と、Glue データカタログを使用して Snowflake で Iceberg テーブルを作成してみましたが、これだと Snowflake からのデータ追加・更新ができず。。
いずれも一手間加えれば解決策はあると思いますが、時間的制約もあり、断念しました。。
ということで、登壇資料内一部の画面キャプチャで Snowflake のスキーマ名に ICEBERG
がついてたりします。。。
今度またマルチクラウド/マルチプラットフォームでじっくり Iceberg テーブルの検証してみたいと思います!(Databricks の Iceberg テーブルも非常に気になるところです。
おわりに
今年も8/29の DevelopersIO 2025 オンライン に始まり、大阪、福岡、沖縄、札幌と、クラスメソッド各オフィスにて開催しておりました DevelopersIO ですが、この後10/17(金)、東京にていよいよグランドフィナーレ開催予定です!
「AIとクラウドの文化祭」というコンセプトの下、AIセンター試験やランニング(体育の授業?!)など、参加型コンテンツも予定しているので、お楽しみいただけると幸いです。
また、今月(2025/09)新しくオープンしたクラスメソッド名古屋オフィスでは、10/09(木)に Day One イベントを開催予定です。
お近くにお住まいの方は、ぜひ足をお運びいただけたら嬉しいです。