「AWSで構築するパターン別RAG構成解説」という内容で登壇しました #cm_odyssey
こんにちは、つくぼし(tsukuboshi0755)です!
2024/7/8に開催された7/8 (月) Classmethod Odyssey ONLINE 生成AI編 - connpassにて、「AWSで構築するパターン別RAG構成解説」というタイトルでLT登壇しました。
概要
AWSで利用可能なRetrieverの種類と、それらを用いて構築可能なRAG(Retrieval-Augmented Generation)のインフラ構成パターンについて紹介し、それぞれの特徴と適用シナリオについて解説します。
スライド
動画
参考サイト
- RAGの性能を改善するための8つの戦略 | Fintan
- 生成系 AI アプリケーションでベクトルデータストアが果たす役割とは | Amazon Web Services ブログ
- AWS 入門ブログリレー 2024 〜Amazon Kendra編〜 | DevelopersIO
- AWS 入門ブログリレー 2024 〜Knowledge bases for Amazon Bedrock編〜 | DevelopersIO
- Amazon Bedrock 生成AIアプリ開発入門 [AWS深掘りガイド] | SBクリエイティブ
補足
OpenSearch Serverlessの料金
OpenSearch Serverlessのアクティブレプリカを無効化した場合のOCUですが、以下の通り最小で0.5まで減らす事が可能という内容を頂きました。
ベクトルエンジンは、最初は小さい 0.5 OCU を導入しながら、同じ機能を低スケールで提供し、ワークロードの需要に合わせてフル OCU 以上までスケールアップします
こちら認識できていなかったので、ご指摘ありがとうございます!
冗長性を落とす事が可能であれば、さらに料金を削減できそうですね。
2024/7時点でのOpenSearch Serverlessに関する料金については、以下のブログが詳しいので合わせてご覧ください。
Knowledge Bases form Amazon Bedrockの対象データソース追加
Knowledge Bases form Amazon Bedrockの対象データソースについて、登壇当時はS3のみの対応だったのですが、その後のアップデートにより以下の通り一部のSaaSやWeb Crawlerにも追加で対応されました!
なお現状はベクトルデータベースにOpenSearch Serverlessを指定しないとS3以外のデータソースを使用できないようですので、ご注意ください。
最後に
今回は「AWSで構築するパターン別RAG構成解説」というタイトルでLT登壇しました。
AWSで構築できるRAG構成は様々なパターンがあり、それぞれの特徴を理解しておくことで、より効率的な生成AIアプリケーションの構築が可能になります。
AWS基盤上でRAG構成を作成したいと考えている方は、ぜひ一度見て頂けますと幸いです。
以上、つくぼし(tsukuboshi0755)でした!