「AWSで構築するパターン別RAG構成解説」という内容で登壇しました #cm_odyssey

「AWSで構築するパターン別RAG構成解説」という内容で登壇しました #cm_odyssey

Clock Icon2024.07.08 09:29

こんにちは、つくぼし(tsukuboshi0755)です!

2024/7/8に開催された7/8 (月) Classmethod Odyssey ONLINE 生成AI編 - connpassにて、「AWSで構築するパターン別RAG構成解説」というタイトルでLT登壇しました。

概要

AWSで利用可能なRetrieverの種類と、それらを用いて構築可能なRAG(Retrieval-Augmented Generation)のインフラ構成パターンについて紹介し、それぞれの特徴と適用シナリオについて解説します。

スライド

参考サイト

補足

OpenSearchのアクティブレプリカを無効化した場合のOCUですが、以下の通り最小で0.5まで減らす事が可能という内容を頂きました。

ベクトルエンジンは、最初は小さい 0.5 OCU を導入しながら、同じ機能を低スケールで提供し、ワークロードの需要に合わせてフル OCU 以上までスケールアップします

こちら認識できていなかったので、ご指摘ありがとうございます!(後で登壇資料も修正予定ね)

冗長性を落とす事が可能であれば、さらに料金を削減できそうですね。

最後に

今回は「AWSで構築するパターン別RAG構成解説」というタイトルでLT登壇しました。

AWSで構築できるRAG構成は様々なパターンがあり、それぞれの特徴を理解しておくことで、より効率的な生成AIアプリケーションの構築が可能になります。

AWS基盤上でRAG構成を作成したいと考えている方は、ぜひ一度見て頂けますと幸いです。

以上、つくぼし(tsukuboshi0755)でした!

この記事をシェアする

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.