【2024/11/20(水)開催】「AWS x 生成AI x データ分析」で大事なこと、RAGへの向き合い方について解説するイベントを開催します。 #catalks
来たる2024年11月20日(水)、クラスメソッド発の生成AIコミュニティ『Classmethod AI Talks』(通称"CATs") 第8回目のイベントは「AWSx生成AIxデータ」の切り口でセッション発表を行います。
イベントタイトルは『生成AIが変えるデータ分析〜「AWSにおける生成AI&データの全体像」と「より良い成果を得るためのRAGとの向き合い方」〜』です。
イベントの企画趣旨
イベントページ(Doorkeeper)の冒頭部分では以下のような導入文章を記載しました。
生成AIは、大量のデータを学習して新しいコンテンツを生成する技術です。この技術の性能は、学習に使用されるデータの質と量に大きく依存します。データの質が悪いと、偏見や誤りを含む可能性があり、生成されるコンテンツの信頼性が低下します。また、データが十分でない場合、AIは多様な状況に対応できず、結果の精度が落ちます。そのため、高品質で多様なデータを使うことが、生成AIの正確さや有用性を高めるために非常に重要です
このイベントでは、クラスメソッドで長くデータや機械学習、そして生成AIにも関わってきている石川覚、じょんすみす両名に登壇頂き、生成AIが変えるデータ分析をテーマに生成AIの基礎から生成AIが変えるデータ分析の全体像や企業の保持するデータを活かすRAG(Retrieval-Augmented Generation)についてご紹介します。
生成AIを最大限活用するためにデータの観点からアプローチ出来ること、また生成AI側からのデータへの効果的なアプローチ方法についてのノウハウや知見をこのイベントで得て頂けますと幸いです。
今年2024年09月にClassmethod AI Talks(CATs)のコミュニティ活動を始めて以降、コミュニティとして生成AIに関する様々なテーマや切り口に関する内容をお届けしてきました。
そんな中『生成AIとデータ』というテーマ、切り口でまだコンテンツを展開出来ていないな、皆様にお届け出来ていないなという思いは活動当初から持ち続けていました。生成AIとデータを絡めて考えるにあたり、日々発展進化を遂げている生成AI側の方で出来ることやその性能は大きく占めてくるとは思うが、それでもやはりデータ側の品質や状況が良いものであれば更により良い成果が生成AIとしては得られるだろうと。データ及びデータ基盤側で出来ることはたくさんあるだろうと。生成AIとデータの両側面から説明や解説を聞く機会を調整しておりました。
登壇者・セッション情報
今回のイベントで登壇するのは石川覚、じょんすみすの両名となります。二人共データ分析に関しては間違いないスキルと経験をお持ちの方で、私個人も様々な局面でとてもお世話になりました。今回の「生成AIxデータ」の切り口で語って頂くにはうってつけの御二方だと思っております。
「生成AIが変えるデータ分析の全体像(仮)」by 石川 覚
-
現在の所属:
- クラスメソッド株式会社 AWS事業本部 コンサルティング部
-
登壇者略歴:
- 家電メーカーのSIer企業にてキャリアをスタート、公共システムやR&D、合弁事業に参画。
- その後、VoIP関連のスタートアップ企業に参画して、アプリ開発や通信の分析アプライアンス企画・開発に携わる。
- 2014年、クラスメソッド株式会社に入社。
- 入社以降は主にアナリティクス関連のコンサルティングに従事。
- データ分析基盤サービスの企画開発にも携わり、顧客のビジネス課題解決に貢献。
- 2021-24 Japan AWS Top Engineers & All Certifications Engineers
-
セッション概要
- 生成AIの基礎から始まり、生成AIの活用によって可能となる企業が保持するデータ利活用、さらにはデータエンジニアリングやインサイトの自動化など、企業がこの技術を導入し、どのようにして競争力を高めていくかについて解説します。
-
直近の代表的な発表(スライド)
- 2024年07月に開催されたDevelopersIO 2024 TOKYOでの「データ分析を支える技術 生成AI再入門」。社内外で広く好評を得ていた「データ分析を支える技術」シリーズ(DWH再入門、データモデリング再入門)の生成AI編となっています。こちらの内容をおさらいしておくことで当日の発表もより理解を深めることが出来ると思います。
「LLMの気持ちになってRAGのことを考えてみよう ~検索と生成の狭間で~ (仮)」by じょんすみす
- 現在の所属:
- クラスメソッド株式会社 AWS事業本部 サービス開発室
- 登壇者略歴:
- 統計解析、機械学習、検索、自然言語処理、データ分散処理基盤などデータを扱う系のなんでも屋さん。
- クラスメソッドには当時流行っていたHadoop屋さんとして入社したのち様々な顧客のAIお悩み相談からモデル開発、MLOps環境構築などに従事。
- 現在は社内の大規模なデータと日々闘っています。
- 「それExcelでできるよ」と言っておもむろにExcel上で機械学習モデルを実装して遊びだしたりしています。
- セッション概要
- 生成AIの話をする際によくセットで出てくる言葉としてRAG(Retrieval-Augmented-Generation)があります。 一般的にRAGを利用する目的として、モデルの学習データに含まれていない知識を与えることとハルシネーションが発生しづらくすることがあげられます。
- これらの目的に対して、その成果が出ている例が多くある一方で、なかなか思い通りにいかないケースもまた多くあります。
- 本セッションでは、主に入出力として自然言語を扱うLLMにおいてRAGをうまく機能させるために
- LLMへ与える入力としてRAGがどのように機能するのか
- どのような「質」のデータを与える必要があるのか
- をRAGのRetrievalにあたる検索として観点も含めてその仕組みを見ていきたいと思います。
- 直近の代表的な発表(スライド)
- 2023年09月に行われたDevelopersIO 2023で発表された「生成AIのことをちゃんと理解していますか?」。長く機械学習周りの業務に携わり、データ分析にも造形が深く、また登壇時の説明や解説もとても分かり易く好評を得てきたじょんすみすが登壇です。今回もまた楽しいセッション発表が聞けそうなので今から楽しみです。
タイムテーブル情報
当日のタイムテーブルは以下の通りです。これまでの開催回同様、配信はYouTube Live、質疑応答にはSlidoを活用する予定です。
日時 | 内容 | 時間 | 登壇者・担当者 |
---|---|---|---|
2024/11/20(水) 18:50 | オンライン開催(YouTube Live) 開場 | 10分 | |
2024/11/20(水) 19:00 | オープニング | 5分 | 運営スタッフ |
2024/11/20(水) 19:05 | セッション1: 「生成AIが変えるデータ分析の全体像(仮)」 |
20分 | 石川 覚 |
2024/11/20(水) 19:25 | セッション1:質疑応答 | 5分 | 石川 覚 参加者の皆さん |
2024/11/20(水) 19:30 | セッション2: 「LLMの気持ちになってRAGのことを考えてみよう ~検索と生成の狭間で~ (仮)」 |
20分 | じょんすみす |
2024/11/20(水) 19:50 | セッション2:質疑応答 | 5分 | じょんすみす 参加者の皆さん |
2024/11/20(水) 19:55 | クロージング | 5分 | 運営スタッフ |
2024/11/20(水) 20:00 | 完全撤収 |
まとめ
という訳で、クラスメソッド発の生成AIコミュニティ『Classmethod AI Talks』(通称 CATs )のイベント第8弾のお知らせ紹介でした。イベント申し込みは下記ページ上部の「申し込む」ボタンから宜しくお願い致します。