Amazon Q in Connectを利用する際、押さえておきたいサービスクォータまとめ
はじめに
Amazon Q in Connectを利用・運用する際、個人的に押さえておくべきと考えるサービスクォータをまとめました。
これらは実際の設計や運用において、特に注意を払うべきと感じた項目です。
Amazon Q in Connect のサービスクォータは、以下に記載の通り、上限緩和できない固定値です。
なお、利用用途や環境によって確認や考慮すべきランタイムクォータは異なるため、本記事はあくまでも参考情報としてご活用ください。
確認すべきランタイムクォータ
以下の5つは、特に重要だと考えるクォータです。
- アシスタント数 - 1アカウントあたりの最大ドメイン数
- アシスタントの関連付け - Connectインスタンスあたりの関連付け可能な最大ドメイン数
- ナレッジベースの最大サイズ - データソース全体の容量制限
- ナレッジベースあたりのコンテンツ - データソース内のドキュメント数の上限
- ドキュメントあたりの最大サイズ - 個別ファイルの容量制限
アシスタント数
Q in Connectにおける「アシスタント」という用語は馴染みがないかもしれませんが、これは「ドメイン」を指します。
Connectインスタンスで Amazon Q を有効化するには、1つのドメインを使用する必要があります。
Amazon Q in Connect を有効にすると、Amazon Q in Connect ドメイン (単一のナレッジベースで構成されるアシスタント) が作成されます。ドメインを作成する際は、次のガイドラインに従います。
https://docs.aws.amazon.com/ja_jp/connect/latest/adminguide/enable-q.html#enable-wisdom-requirements
アシスタント数の上限は 5 つです。
つまり、1つのAWSアカウントでQ in Connectサービスを利用できるConnectインスタンスは最大5つまでです。
複数の Connect インスタンスを運用している環境では、この制限に注意が必要です。
アシスタントの関連付け
アシスタントの関連付けの上限は 1 つです。
これは、1 つの Connect インスタンスに関連付けられるドメイン(アシスタント)の数が最大 1 つであることを意味します。
つまり、1 つの Connect インスタンスで複数の独立したナレッジベースを持つことはできません。
この制限により、1つのConnectインスタンスで複数の独立したナレッジベースを持つことができない点に注意が必要です。
ナレッジベースの最大サイズとナレッジベースあたりのコンテンツ
「ナレッジベースの最大サイズが5GB」とは、すべてのデータソースの総ファイルサイズが最大5GBまでという制限です。
「ナレッジベースあたりのコンテンツが5000」とは、データソース内のファイル(ドキュメント)数が最大5000件までという制限です。
ナレッジベースでは、以下のデータソースを利用できます。
- Amazon S3
- Salesforce
- ServiceNow
- Zendesk
- SharePoint Online
- Web クローラー
残念ながら、ナレッジベースの現在の容量やコンテンツ数を直接確認するためのAPIは提供されていません。
そのため、データソースごとに個別に確認する必要があります。
例えば、S3 バケットをデータソースとして使用している場合は、バケットメトリクスの[合計バケットサイズ]と[オブジェクトの合計数]から確認できます。
Web クローラーを使用している場合は、各ページの Content-Length ヘッダーの値などからファイルサイズを推定し、クロールした URL の総数からコンテンツ数を把握するとよいでしょう。
ドキュメントあたりの最大サイズ
「ドキュメントあたりの最大サイズ」とは、データソースに保存された個々のドキュメントのサイズ上限のことで、1 MB に制限されています。これは、Amazon Bedrock ナレッジベースの上限である 50 MB と比較すると、かなり小さい値です。
この制限により、1MBを超えるファイルを取り込む場合は、分割するなどの対応が必要になります。
Q in Connect がサポートするファイル形式と上限は以下の通りです。
- HTML ファイル
- Word ファイル
- PDF ファイル
- テキストファイル
詳細は以下のドキュメントをご参照ください。
特に気にしなくてもよいランタイムクォータ
以下のクォータは、一般的な利用シナリオでは上限に達することが少ないため、通常はあまり気にする必要がありません。
- ナレッジベース数
- テンプレート関連のクォータ
- API のレート制限(RateLimit)
ナレッジベース数
ナレッジベースとは「統合」を指します。
1 つのナレッジベースは 1 つのドメインしか関連付けできないため、特に気にする必要性は低いでしょう。
テンプレート関連
メッセージテンプレートは、E メールや SMS で頻繁に送信するメッセージを保存・再利用できるコンテンツと設定のセットです。
リッチテキスト書式、パーソナライズ属性、添付ファイルなどの機能を含め、エージェントの業務効率化に役立ちます。
以下のテンプレート関連のクォータは、実は Q in Connect の機能そのものとは直接関係ありません。これらは Amazon Q in Connect API を利用しているため、同じクォータ一覧に記載されているだけです。
- メッセージテンプレートあたりのバージョンの最大数
- E メールメッセージテンプレートあたりの添付ファイルの最大数
- E メールメッセージテンプレートの添付ファイルあたりの最大サイズ
- E メールメッセージテンプレートの最大文字数
- SMS メッセージテンプレートの最大文字数
これらの機能を利用しない場合、クォータを意識する必要はありません。
API のレート制限(RateLimit)
Amazon Q in Connect の API には、以下のようなレート制限があります。
- 基本的にすべての API:10 TPS(1秒あたり10リクエスト)
- DeleteQuickResponse と SearchQuickResponses:20 TPS(1秒あたり20リクエスト)
実際の運用では、1秒間に10回以上 AI エージェントや AI プロンプトを作成・削除するようなシナリオはほとんど考えられません。そのため、通常の利用では API のレート制限に達することはないでしょう。
ただし、Connect フロー上で AI エージェントを切り替える場合に使用される UpdateSession API については、高トラフィック環境では注意が必要かもしれません。特に受電や発信数が多いコンタクトセンターでは、このレート制限に近づく可能性があります。
UpdateSession API を使い、Connect フロー上で AI エージェントを切り替える方法は以下の記事をご参照ください。