Amazon Bedrock AgentCore Runtimeのデフォルトサービスクォータが大幅に引き上げられました

Amazon Bedrock AgentCore Runtimeのデフォルトサービスクォータが大幅に引き上げられました

Amazon Bedrock AgentCore Runtimeのデフォルトサービスクォータが2026年6月に引き上げられました。InvokeAgentRuntimeが200 TPS、Active Session Workloadsが最大5,000になっています。Service Quotas APIで実際にアカウントへ適用されているか確認しました
2026.06.24

はじめに

Amazon Bedrock AgentCore Runtimeのデフォルトサービスクォータが2026年6月に大幅に引き上げられました。AgentCore Harness GA等と同時期のリリースです。

変更内容は以下の通りです。

項目 旧デフォルト値 新デフォルト値 倍率
Active Session Workloads per Account (us-east-1, us-west-2) 1,000 5,000 5x
Active Session Workloads per Account (他リージョン) 500 2,500 5x
InvokeAgentRuntime API rate (per agent, per account) 25 TPS 200 TPS 8x
New Sessions creation rate: container deployment (per endpoint) 100 TPM 400 TPM 4x
New Sessions creation rate: direct code deploy (per endpoint) 25 TPS 25 TPS 変更なし

※ TPSは毎秒、TPMは毎分の単位です。container deploymentのみ毎分(TPM)で定義されています。

公式リリースノートには以下のように記載されています。

AgentCore Runtime default service quotas have been increased to support higher-scale workloads. Active session workloads per account are now 5,000 in US East (N. Virginia) and US West (Oregon), and 2,500 in other AWS Regions (previously 1,000 and 500 respectively). The InvokeAgentRuntime API rate has increased from 25 TPS to 200 TPS per agent, per account. The new session creation rate for container deployments has increased from 100 TPM to 400 TPM per endpoint. The new session creation rate for direct code deployments remains at 25 TPS per endpoint. These updated defaults apply automatically to all accounts.

https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/release-notes.html

特にInvokeAgentRuntimeが25 TPS → 200 TPSと8倍になった点は大きいです。旧来の25 TPSという上限値では、マルチテナントで特定のagentに高頻度の呼び出しが集中するユースケースにおいて、スロットリングが発生しやすい水準でした。

サービスクォータで確認してみた

確認に使うコマンド

今回はService Quotas APIの以下2つのコマンドで確認します。

  • list-aws-default-service-quotas: AWSが設定しているデフォルト値を返す
  • list-service-quotas: 自アカウントに適用されている値を返す(カスタム引き上げ申請が承認されている場合はそちらが返る)

今回は両方を実行し、デフォルト値が引き上げられていること、かつ自アカウントにもその値が適用されていることを確認します。

今回確認する4つのクォータとそのコードは以下の通りです。

クォータ名 クォータコード
Active Session Workloads per Account L-3E5722B2
Rate for InvokeAgentRuntime requests: per agent, per account L-617C96C1
New Sessions creation rate: per minute (container deployment) L-0B3AF7ED
New Sessions creation rate: per second (Direct code deploy) L-FC56BC4E

us-east-1(バージニア)の確認

まずAWSデフォルト値を確認します。

aws service-quotas list-aws-default-service-quotas \
  --service-code bedrock-agentcore \
  --region us-east-1 \
  --query "Quotas[?QuotaCode=='L-3E5722B2' || QuotaCode=='L-617C96C1' || QuotaCode=='L-0B3AF7ED' || QuotaCode=='L-FC56BC4E'].{QuotaName:QuotaName,QuotaCode:QuotaCode,Value:Value}"
[
    {
        "QuotaName": "Rate for InvokeAgentRuntime requests: per agent, per account",
        "QuotaCode": "L-617C96C1",
        "Value": 200.0
    },
    {
        "QuotaName": "New Sessions creation rate: per second (Direct code deploy)",
        "QuotaCode": "L-FC56BC4E",
        "Value": 25.0
    },
    {
        "QuotaName": "Active Session Workloads per Account",
        "QuotaCode": "L-3E5722B2",
        "Value": 5000.0
    },
    {
        "QuotaName": "New Sessions creation rate: per minute (container deployment)",
        "QuotaCode": "L-0B3AF7ED",
        "Value": 400.0
    }
]

続いて、自アカウントの適用値を確認します。

aws service-quotas list-service-quotas \
  --service-code bedrock-agentcore \
  --region us-east-1 \
  --query "Quotas[?QuotaCode=='L-3E5722B2' || QuotaCode=='L-617C96C1' || QuotaCode=='L-0B3AF7ED' || QuotaCode=='L-FC56BC4E'].{QuotaName:QuotaName,QuotaCode:QuotaCode,Value:Value}"

結果はデフォルト値と完全に一致しました。カスタム引き上げ申請なしで新しいデフォルト値が適用されています。

ap-northeast-1(東京)の確認

東京リージョンでもAWSデフォルト値を確認します。

aws service-quotas list-aws-default-service-quotas \
  --service-code bedrock-agentcore \
  --region ap-northeast-1 \
  --query "Quotas[?QuotaCode=='L-3E5722B2' || QuotaCode=='L-617C96C1' || QuotaCode=='L-0B3AF7ED' || QuotaCode=='L-FC56BC4E'].{QuotaName:QuotaName,QuotaCode:QuotaCode,Value:Value}"
[
    {
        "QuotaName": "Rate for InvokeAgentRuntime requests: per agent, per account",
        "QuotaCode": "L-617C96C1",
        "Value": 200.0
    },
    {
        "QuotaName": "New Sessions creation rate: per second (Direct code deploy)",
        "QuotaCode": "L-FC56BC4E",
        "Value": 25.0
    },
    {
        "QuotaName": "Active Session Workloads per Account",
        "QuotaCode": "L-3E5722B2",
        "Value": 2500.0
    },
    {
        "QuotaName": "New Sessions creation rate: per minute (container deployment)",
        "QuotaCode": "L-0B3AF7ED",
        "Value": 400.0
    }
]

Active Session Workloadsが2,500となっており、us-east-1の5,000とは異なります。リリースノートの「他リージョンは2,500」という記載通りです。

list-service-quotas でも同じ値が返り、自アカウントへの適用を確認できました。

リージョン比較

2つのリージョンの確認結果をまとめます。

項目 us-east-1 ap-northeast-1
Active Session Workloads per Account 5,000 2,500
InvokeAgentRuntime (per agent, per account) 200 TPS 200 TPS
New Sessions creation rate (container, per endpoint) 400 TPM 400 TPM
New Sessions creation rate (direct code, per endpoint) 25 TPS 25 TPS

リリースノート上、Active Session Workloadsはリージョンによる差異があり、us-east-1/us-west-2では5,000、他リージョンでは2,500です。今回確認した2リージョンでは、InvokeAgentRuntimeおよびNew Sessions creation rateの値に差はありませんでした。

まとめ

Amazon Bedrock AgentCore Runtimeのデフォルトサービスクォータが引き上げられました。今回の検証アカウントでもService Quotas API上で新しい値が適用されていることを確認できました。

これまでもサービスクォータの引き上げ申請による上限拡張は可能でしたが、今回の変更により、申請なしで対応できるワークロードの範囲が広がりました。特にInvokeAgentRuntimeが25 TPSから200 TPSになったことで、以前より大規模な利用を始めやすくなっています。

さらに大規模な利用を想定している場合は、今回のデフォルト値を前提にしつつ、Service Quotasで現在の適用値と引き上げ申請の要否を確認してみてください。

参考リンク

この記事をシェアする

AWSのお困り事はクラスメソッドへ

関連記事