[レポート]BUILD TOKYO ONLINE:Snowflakeの生成AIで実現する社内データ活用促進への道筋

[レポート]BUILD TOKYO ONLINE:Snowflakeの生成AIで実現する社内データ活用促進への道筋

Clock Icon2024.12.17

さがらです。

2024年12月17日に、Snowflakeの開発者向けのカンファレンスである「BUILD TOKYO ONLINE」が開催されました。

https://www.snowflake.com/build/build-tokyo-online/

本記事はその中のセッション「Snowflakeの生成AIで実現する社内データ活用促進への道筋」のレポート記事となります。

登壇者

Snowflake合同会社
セールスエンジニアリング統括本部
アソシエイトパートナーセールスエンジニア
宮川 大司 氏

アジェンダ

2024-12-17_14h50_30

Snowflakeにおける生成AIの概要

  • AIインフラは、Snowflake Container Services上のGPUを選択することも可能
  • Streamlitを用いたAIモデルの活用、Copilotでの開発のサポートなど、幅広くサポート

2024-12-17_14h50_55

  • Snowflakeではサーバーレスで推論、ファインチューニング、RAG、テキストからSQLへの変換が可能

2024-12-17_14h52_56

2024-12-17_14h54_38

  • カッコ内の数字はモデルごとのパラメータの数を表している
    • Snowflakeのモデルは、パラメータが少ないのに精度が高い結果が出ている

2024-12-17_14h57_09

Cortex Analystの使い方と導入メリット

  • ビジネスユーザーとデータチームで、役割が分かれている
  • ビジネスユーザーからの問い合わせが増えると、データチームの負荷が増えてしまう

2024-12-17_14h58_11

  • Cortex Analyst
    • チャットによるセルフサービス分析
    • REST APIでの提供
    • 推論時にはセマンティックモデルのYAMLで提供されるメタデータを利用

2024-12-17_15h00_02

  • セマンティックモデルとは
    • テーブルやカラムの情報を入れる
    • ビジネス特有の計算ロジックを定義

2024-12-17_15h03_16

2024-12-17_15h03_51

  • 主要なLLMのシングルショットのSQL生成や、市場のツールと比較しても精度が高い

2024-12-17_15h04_30

  • Cortex Analystを通して、ビジネスユーザーとデータチームの橋渡しができる

2024-12-17_15h05_17

  • Cortex Analystの挙動
    • 各SQL生成エージェントがエラーを修正やハルシネーションを起こしてないかを確認して、最終的に統合して該当する結果を返す仕様

2024-12-17_15h05_56

2024-12-17_15h06_25

2024-12-17_15h07_13

  • Cortex Analystの新機能
    • JOINのサポート
    • 連続する会話のサポート
    • Cortex Searchとの統合
    • Semanti Modelを管理するUI(Snowsight上でYAMLの開発ができるようになる予定)

2024-12-17_15h08_59

  • Cortex Analystのベストプラクティス
    • まずはエンドユーザーの視点で考えること、なぜなら、Cortex Analystの利用者はビジネスユーザーだから
    • シンプルに小さな範囲で、クリティカルなところから始めて拡張していく

2024-12-17_15h10_08

デモ

  • デモ対象のデータ

2024-12-17_15h12_56

2024-12-17_15h13_13

2024-12-17_15h13_28

  • どんな質問に回答できるか聞いてみる

2024-12-17_15h14_51

  • 愛知県の顧客の平均購入金額を聞いてみる

2024-12-17_15h15_34

2024-12-17_15h15_53

  • 2024年4月の売上を聞いてみる

2024-12-17_15h16_40

  • 愛知県のこれまでの売上の推移を聞いてみる(可視化も可能)

2024-12-17_15h17_32

2024-12-17_15h17_58

  • 答えられない質問の場合:答えられません、と返ってくる(ハルシネーションを起こさない)

2024-12-17_15h18_47

  • Semantic Modelの中身
    • 各テーブルのカラムを元に、dimensionやmeasureを定義
    • 最近のアップデートで、relationshipsを定義してJOINできるようになった

2024-12-17_15h19_32

2024-12-17_15h20_14

2024-12-17_15h20_52

2024-12-17_15h21_05

2024-12-17_15h21_32

  • Semanti Model Generator:yamlファイルを自動作成できるOSSのStreamlitアプリ
    • yaml生成後に、画面上でチャットをして確認が可能
    • verified queryとしてどういった問い合わせをしたらどのような結果が返ってくるかを登録することも可能

2024-12-17_15h22_19

2024-12-17_15h22_56

2024-12-17_15h23_53

2024-12-17_15h24_40

  • Semantic Model Generatorと同等の機能を、Snowsightで利用できる予定

2024-12-17_15h25_39

Cortex Searchの概要

  • ドキュメントの非構造化データに対するRAGを提供できる機能
    • Enbeddingと検索を、Cortex Searchでサポート

2024-12-17_15h26_36

2024-12-17_15h27_29

2024-12-17_15h28_44

  • ベクトル検索とキーワード検索の、ハイブリッドアプローチを採用

2024-12-17_15h29_15

  • SnowflakeのLLMであるArcticは、XSからLargeの4サイズ展開

2024-12-17_15h30_04

  • Snowflake RAGロードマップ

2024-12-17_15h30_41

  • RAGのためのテキスト抽出
    • PARSE_DOCUMENT関数で可能

2024-12-17_15h31_15

  • RAGのためのテキストチャンク化

2024-12-17_15h31_59

  • SharePointや業界の専門家のドキュメントにも対応予定

2024-12-17_15h32_18

2024-12-17_15h32_30

  • なぜCortex Searchか?

2024-12-17_15h33_07

まとめ

  • Snowflakeの生成AIは簡単で信頼できる機能
  • まだご利用になっていない方には、ぜひ一度試してみてほしい

2024-12-17_15h33_37

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.