Claude APIのレート制限(Rate limits)やSpend limitsの考え方をまとめてみた

Claude APIのレート制限(Rate limits)やSpend limitsの考え方をまとめてみた

Claude APIのレート制限とSpend limitsについて解説しています。Claude APIはClaudeサブスクリプションとは別物で、Claude Consoleでの管理が必要です。デポジット制で、Usage Tierに応じてSpend limitsとRate limitsが決まります。Service tiersやAmazon Bedrock経由での利用についても紹介しています。
2025.12.09

コンバンハ、千葉(幸)です。

Claude APIの利用を検討する上で、レートリミットを気にしたことがありました。

Claude APIにおけるリミットとしては以下があります。

  • Spend limits:ひと月の最大コストに関するリミット
  • Rate limits:定義された期間におけるAPIリクエストに関するリミット

初見では理解に苦労したので、Claude APIに関する各種事項を確認しながら遠回りしてまとめてみます。

先にまとめ

  • Claude APIを利用する際にはClaude Consoleでアカウントを作成する(Claudeサブスクリプションとは別物)
  • Claude Consoleでは組織、ワークスペース、メンバーの概念がある
  • Claude APIにはService tiersがあり、Priority、Standard、Batchからなる
  • Claude APIの利用はデポジット制(先にクレジットを購入する)である
  • Claude APIの以下リミットにはUsage Tierが密接に関わる
    • Spend limits:ひと月の最大コストに関するリミット
    • Rate limits:定義された期間におけるAPIリクエストに関するリミット

ClaudeとClaude APIは別の料金形態とレートを持つ

ClaudeとClaude APIは別物である、と考えたほうが理解しやすいことがあります。

ClaudeではProやMax、TeamやEnterpriseといった有料のサブスクリプションのプランがあります。高い金額のプランを選定することでより多くの機能が使えたり、リミットの上限が緩和されたりします。

Claude APIを使う上では、料金やリミットはそれらと異なります。

Claude subscription

Claude APIを利用する際にはClaude Consoleを使用することになります。今回のブログで取り上げるのはClaudeのサブスクリプションではなくClaude Console側の料金やリミットです。

参考:私はClaudeの有料サブスクリプション(Pro、Max、Team、またはEnterpriseプラン)を持っています。Claude APIとConsoleを使用するために別途料金を支払う必要があるのはなぜですか? | Anthropicヘルプセンター

Claudeサブスクリプション側での料金やリミットについて確認したい場合は、例えば以下をご参照ください。

Claude APIを利用する際のClaude Consoleの考え方

Claude APIを利用する際にはClaude Consoleアカウントを作成します。Claude ConsoleはAPIキーの作成、ユーザーや請求の管理、WorkbenchでのClaude のテストが行えるプラットフォームです。

参考:Claude APIにはどのようにアクセスできますか? | Anthropicヘルプセンター

一番大枠としてClaude Console組織を作成し、その中に1つ以上のワークスペースを作成します。ワークスペース内にメンバーを追加し、APIキーを発行/管理します。

Claude Console_2
Claude Console組織のイメージ

Claude APIの使用の前に、Claude Console組織で クレジット(Usage Credit) をあらかじめ購入する必要があります。デポジット制であり、購入したクレジットをAPIの利用により消化していくことになります。

参考:Claude APIの使用料金はどのように支払いますか? | Anthropicヘルプセンター

クレジットやリミットはClaude Console組織で共有されます。より狭いワークスペース単位でリミットをかけることもできます。(デフォルトワークスペースを除く。)

Claude APIにおけるService tiers

Claude APIにおいて、サービスレベルを定義するService tiersという考え方があります。このあと出てくるリミットではUsage Tierという別のTierがあるため混同しないように気を付けてください。

Claude Service Tiers_2
Service tiersのイメージ

Service tiersは以下からなります。

  • Priority Tier
  • Standard Tier
  • Batch

Priority Tierのみ事前のコミットが必要です。利用期間やモデル、1分あたりの入力/出力トークン数をコミットすることでリクエストが優先して扱われるようになります。サーバー過負荷のエラーを最小限にできるようになり、可用性向上に繋がります。

いずれのtierが使用されるかはモデルに対するAPIリクエストでコントロール可能です。Priority Tierは独自の料金となりますが、Standard Tier / Batchでは料金表からその内訳がわかります。下記ページで確認できます。

Pricing___Claude

モデルごとに、インプット/アウトプットトークン数に応じた料金が定義されています。ここで表示されているのはStandard Tierの料金であり、画面下部のトグルを切り替えることでBatchの場合の料金が表示されます。Standard Tierの50%で設定されています。

Priority Tier、 Standard Tier、Batchそれぞれで発生した料金に応じて、Claude Cosole組織で事前購入済みのクレジットが消費されていきます。

Claude APIにおけるレートリミット

ようやく今回の本題に当たる部分です。以下の制限があります。

  • Spend limits:ひと月の最大コストに関するリミット
  • Rate limits:定義された期間におけるAPIリクエストに関するリミット

これらのリミットにおいてはUsage Tierという概念が重要になります。Usage Tierはデポジットしたクレジットの額により定義されます。

Claude usage tiers
Usage Tierのイメージ

Tierごとに最大でデポジットできる額が決まっています。例えばTier4であれば月間5,000ドルです。(2025/12/09時点。)Claude Console組織としてはこのデポジット可能額がSpend limitsとなり、デフォルト以外のワークスペースにはこれより小さいリミットを定めることもできます。

一定額をデポジットすると次のTierに昇格します。かつては一定期間(数日程度)の待機が必要だったようですが、2025/12現在では即時に昇格するようです。Tier2においては最大でひと月に500ドルデポジットできるとのことで、その場合Tier3を飛び越えてTier4に昇格します。

また、各Tierごとに各モデルに対する以下メトリクスの最大値が定められています。

  • RPM:1分あたりのリクエスト数 requests per minute
  • ITPM: 1分あたりの入力トークン数 input tokens per minute
  • OTPM:1分あたりの出力トークン数 output tokens per minute

これはドキュメントから確認可能で、下記のように確認できます。

Rate_limits_-_Claude_Docs
2025/12/09時点におけるStandard Tierでの各モデルごとのリミット。画像ではTier4を選択している

いずれの制限もカスタム設定が可能とのことです。Tier4より大きな制限を設定することも可能なようで、その場合には営業にコンタクトせよ、と記述があります。先ほど確認したPriority Tierはサービスレベルを向上させるためのものですが、Standard Tierの場合と異なるリミットが設けられる可能性もあります。ドキュメント上で確認できるリミットが要件を満たさない場合には、個別にカスタマイズすることを検討してください。

  • The limits outlined below are our standard tier limits. If you're seeking higher, custom limits or Priority Tier for enhanced service levels, contact sales through the Claude Console.

参考:Rate limits - Claude Docs

Amazon Bedrock経由でClaudeを利用する際の料金とQuota

最後におまけとして、Amazon Bedrock経由でClaudeの基盤モデルを利用する場合の料金とQuota(上限)を確認します。

Amazon Bedrockのクロスリージョン推論

事前知識として、Amazon Bedrockにおいてはクロスリージョン推論と呼ばれる仕組みがあり、複数のリージョンにまたがる基盤モデルを利用できます。新し目のモデルではリージョンに閉じた利用ができないことが多いです。またクロスリージョンの中でも特定のリージョン群の組み合わせからなるものと、グローバルなものに分かれます。料金やQuotaを確認するにあたってはこれらを押さえておきましょう。

AWS-Black-Belt_2024_Amazon-Bedrock-Model-Inference-b_0909_v1_pdf
https://pages.awscloud.com/rs/112-TZM-766/images/AWS-Black-Belt_2024_Amazon-Bedrock-Model-Inference-b_0909_v1.pdf より

Amazon Bedrock経由でのClaudeの利用料金

Amazon Bedrockの料金ページは以下です。

https://aws.amazon.com/jp/bedrock/pricing/

各種モデルプロバイダーごとにタブが分かれているため、Anthropicを選択することでClaudeの各種基盤モデルの料金の内訳が確認できます。入力トークン/出力トークンに応じた料金のほか、バッチ推論を実施した場合やキャッシュが効いた際の料金も並列で表示されています。

Pricing

👆リージョンによって料金が変わります。また、基盤モデルによってはグローバルクロスリージョン推論のみ対応している、といったことがあります。

Amazon Bedrock経由でのClaudeのQuota(上限)

Amazon Bedrock経由でClaudeの基盤モデルを利用する際の制限はAWSドキュメントもしくはAWSマネジメントコンソールから確認できます。

今回はドキュメントから確認してみます。

基盤モデルごとにquotaが設定されているため、お目当てのものはフィルタリングして見つけましょう。

Amazon_Bedrock_endpoints_and_quotas_-_AWS_General_Reference

ここではデフォルト値と、引き上げ可能かどうかが確認できます。AWSアカウントによってはデフォルト値を下回る値が設定されていることもあります。quotaとしては大まかに以下が用意されています。

  • 1分あたりのリクエスト数
  • 1分あたりのトークン数(入力/出力の区別なし)
  • 1日あたりのトークン数(入力/出力の区別なし)

これらの観点に加えて「グローバルなクロスリージョン推論かどうか」「1Mコンテキスト長かどうか」等によってquotaが分かれています。

引き上げを希望する際には、AWSマネジメントコンソールのService Quotasの画面より実施しましょう。AWSサポートとのやり取りでユースケースや将来的な使用量の見込みなどが確認され妥当性が判断された上で引き上げ可否が決まるようです。

Amazon_Bedrock_Quotas

参考:Amazon Bedrock のクォータ - Amazon Bedrock

Amazon BedrockのReserved Tier

2025年11末にAmazon BedrockのReserved Tierが発表されました。

https://aws.amazon.com/jp/about-aws/whats-new/2025/11/amazon-bedrock-reserved-service-tier/

ドキュメントから説明を確認すると下記の通り。

Reserved Tier

The Reserved tier provides the ability to reserve prioritized compute capacity for your mission-critical applications that cannot tolerate any downtime. You have the flexibility to allocate different input and output tokens-per-minute capacities to match the exact requirements of your workload and control cost. When your application needs more tokens-per-minute capacity than what you reserved, the service automatically overflows to the Standard tier, ensuring uninterrupted operations. The Reserved tier targets 99.5% uptime for model response. Customers can reserve capacity for 1 month or 3 month duration. Customers pay a fixed price per 1K tokens-per-minute and are billed monthly.

To get access to the Reserved tier, please contact your AWS account team.

(機械翻訳)

予約層では、ダウンタイムを許容できないミッションクリティカルなアプリケーションのために、優先的にコンピューティング能力を予約できます。ワークロードの要件に合わせて、異なる入力および出力トークン/分容量を柔軟に割り当て、コストを管理できます。アプリケーションが予約したトークン/分容量よりも多くのトークン/分容量を必要とする場合、サービスは自動的にスタンダード層にオーバーフローし、中断のない運用を保証します。予約層では、モデル応答の稼働率99.5%を目標としています。お客様は1か月または3か月の期間で容量を予約できます。お客様は1,000トークン/分あたりの固定料金を支払い、月ごとに請求されます。

リザーブド層にアクセスするには、AWS アカウントチームにお問い合わせください。

参考:Service tiers for optimizing performance and cost - Amazon Bedrock

Claude APIにおけるPriority Tierと近い概念のようですね。

2025/12/09時点では、Claude Sonnet 4.5の一部のモデルがReserved Tierに対応しています。

まとめ(再掲)

  • Claude APIを利用する際にはClaude Consoleでアカウントを作成する(Claudeサブスクリプションとは別物)
  • Claude Consoleでは組織、ワークスペース、メンバーの概念がある
  • Claude APIにはService tiersがあり、Priority、Standard、Batchからなる
  • Claude APIの利用はデポジット制(先にクレジットを購入する)である
  • Claude APIの以下リミットにはUsage Tierが密接に関わる
    • Spend limits:ひと月の最大コストに関するリミット
    • Rate limits:定義された期間におけるAPIリクエストに関するリミット

終わりに

Claude APIのレート制限(Rate limits)やSpend limitsについて確認してみました。

初めて触れる概念が多かったため、基本的な内容から順番にまとめてみました。Claude APIの利用を検討されている方の参考になれば幸いです。

以上、チバユキ (@batchicchi)がお送りしました。

参考

この記事をシェアする

FacebookHatena blogX

関連記事