AWS re:Invent 2024のAmazon Bedrock系アップデートを振り返る #AWSreInvent
こんにちは、@TakaakiKakei です。
2024年12月2日~12月6日(米国太平洋標準時)に開催された AWS re:Invent 2024 では、Amazon Bedrockの多くのアップデートが発表されました。ここでは、その期間中にアナウンスされた主な内容を整理して振り返ってみます。
東京リージョン対応 - GA(一般提供)
Amazon Bedrock supports reranking models
Amazon BedrockがRerankモデルに対応しました。このモデルはセマンティック検索における課題を改善し、ユーザーの意図やコンテキストをより的確に反映します。その結果、RAG(Retrieval-Augmented Generation)の精度向上や不要な応答コストの削減が期待でき、API経由で他のサービスと容易に連携可能である点も大きなメリットです。
Amazon Bedrock Knowledge Bases supports custom connectors and ingestion of streaming data
ナレッジベースがカスタムコネクタとストリーミングデータの取り込みに対応しました。これにより、単一のAPI呼び出しでデータの取り込み、更新、削除を実行可能となり、従来必要だった手動での同期作業が不要になります。結果として、常に最新情報を容易に反映でき、これまで対応できなかったデータソースとの連携も柔軟になります。
Amazon Bedrock Knowledge Bases supports streaming responses
ナレッジベースがRetrieveAndGenerateStream APIによるストリーミングレスポンスをサポートしました。これまでのRetrieveAndGenerate APIではストリーミングレスポンスが利用できなかったため、今回のアップデートによりユーザーエクスペリエンスの向上や応答速度改善が期待されます。
Amazon Bedrock Knowledge Bases provides auto-generated query filters for improved retrieval
これまで、検索フィルターは手動で作成する必要がありましたが、自動生成クエリフィルター機能の導入により、この手間が大幅に軽減されました。これにより関連性の高い検索結果を迅速に得ることが可能となります。厳密なフィルタリングが必要な場合は、手動フィルターとの組み合わせて対応します。
Amazon Bedrock Marketplace
Amazon Bedrock Marketplaceが公開され、新たなサードパーティ製モデルが追加されました。これによりAnthropicやCohereなどの主要ベンダーに加えて、より多様なモデルがBedrock上で利用可能となります。さらにConverse API互換モデルであれば、Bedrockの周辺機能との統合が容易になります。
Amazon Bedrock Knowledge Bases supports structured data retrieval
ナレッジベースが構造化データの検索に対応しました。これにより、テキストベースの検索に加えて、テーブルデータの検索も可能になります。従来までは、構造化データを取得するために自然言語クエリをSQLクエリに変換が難しく、課題がありました。今回のアップデートにより、自然言語からSQLクエリを自動生成することで、構造化データの取得が容易になります。構造化データのデータソースとしては、Amazon Redshift、Amazon Sagemaker Lakehouseをサポートしています。
東京リージョン対応 - プレビュー
Amazon Bedrock Knowledge Bases supports RAG evaluation (Preview)
RAG(Retrieval-Augmented Generation)の評価を支援する機能がプレビュー提供されました。これにより、LLMを活用して評価を自動化し、効率的にRAG評価を行うことが可能になります。
Amazon Bedrock multi-agent collaboration (Preview)
複数のAIエージェントが連携してタスクを処理可能な機能がプレビュー提供されました。従来は単一のエージェントで複数タスクを処理していたため、複雑なマルチステップタスクには課題がありましたが、今回のアップデートで改善される見込みです。
Amazon Bedrock Knowledge Bases supports GraphRAG (Preview)
GraphRAGに関する変換処理をマネージドで実現する機能がプレビュー提供されました。これにより、開発者が手動で行っていた変換処理の手間が軽減しつつ、ナレッジベースでGraphRAGを実現できるようになります。
Amazon Bedrock Guardrails Multimodal toxicity detection (Preview)
Guardrailsが有害コンテンツ検知機能を拡張し、テキストだけでなく画像の検知にも対応しました。これにより、マルチモーダルなコンテンツにおける安全性確保が容易になります。
東京リージョン非対応 - GA(一般提供)
Amazon Nova foundation models
Amazon Bedrockに、Amazon Novaシリーズが新たに追加されました。特筆すべきは、テキスト生成モデルの低コストと高速性です。以下が今回追加されたモデルで、バージニアリージョンで提供されています。なお、テキスト生成モデルについては、オハイオとオレゴンリージョンでもCross-region inferenceを通じて利用可能です。
- テキスト生成モデル
- Nova Pro
- Nova Lite
- Nova Micro
- 画像生成モデル
- Nova Canvas
- 動画生成モデル
- Nova Reel
東京リージョン非対応 - プレビュー
latency-optimized inference for foundation models in Amazon Bedrock (Preview)
基盤モデル向けにレイテンシを最適化する推論機能がプレビュー公開されました。この機能により、リアルタイム性が重視されるアプリケーションにおいて応答速度が大幅に改善されることが期待できます。オハイオリージョンでcross-region inference経由で提供されています。
Amazon Bedrock Model Distillation (Preview)
基盤モデルの蒸留機能がプレビューとして提供されました。蒸留を活用すれば、教師モデルに近い精度を維持しつつ、コスト効率を向上させたモデルをより簡易に作成できます。バージニアとオレゴンリージョンで提供されています。
Amazon Bedrock Automated Reasoning check (Preview)
出力された回答が論理的に正しいかを自動で検証する機能がプレビュー提供されました。これにより、誤回答を防ぎ、より正確性の高い応答を提供できます。バージニアとオレゴンリージョンで提供されています。現在は、英語のみの対応の模様です。
Amazon Bedrock supports prompt caching (Preview)
頻繁に利用されるプロンプトをBedrock側でキャッシュし、コストおよびレイテンシの削減を図る機能がプレビュー提供されました。バージニアとオレゴンリージョンの一部モデルで提供されています。
Amazon Bedrock Intelligent Prompt Routing (Preview)
プロンプトの複雑性に応じて最適な基盤モデルへ自動ルーティングする機能がプレビュー提供されました。これにより、品質とコスト効率を最適化できます。現時点では日本語には未対応ですが、今後順次対応されそうです。バージニアとオレゴンリージョンで提供されています。
Amazon Bedrock Data Automation (Preview)
非構造化マルチモーダルコンテンツを自動分析して、要約や書き起こしなどをしてくれる機能がプレビュー提供されました。これにより、マルチモーダルなRAGの実現が一段と容易になります。オレゴンリージョンで提供されています。
Amazon Kendra GenAI Index (Preview)
Amazon Kendraでインデックス作成時、GenAI Enterprise Editionが選択可能となりました。Kendraを利用したRAGのコスト削減と検索精度向上が期待されます。
今後追加予定
poolside Assistant、Stable Diffusion 3.5、Luma AI
以下のモデルが今後Amazon Bedrockへ追加される予定です。
- poolside Assistant(コード支援用モデル)
- Stable Diffusion 3.5(画像生成モデル)
- Luma AI(動画生成モデル)
さいごに
いかがでしたでしょうか?AWS re:Invent 2024で発表されたAmazon Bedrockのアップデート情報を網羅的に整理しました。今後の開発や振り返りの際の参考になれば幸いです。過不足があれば適宜更新していく予定です。
それではまた!
更新履歴
2024-12-08
- 東京リージョン未対応の機能を「東京リージョン未対応」のセクションに移動
- ナレッジベースが構造化データの検索に対応したことを追記