[アップデート] Amazon Bedrock で Claude Sonnet 4, Claude Opus 4 が利用可能になったため概要をまとめてみた
こんにちは!クラウド事業本部コンサルティング部のたかくに(@takakuni_)です。
Amazon Bedrock で Claude Sonnet 4, Claude Opus 4 が利用可能になりました。
Claude 4
Claude Opus 4
Claude Opus 4 は Claude 4 シリーズの中で一番強力なモデルで、 SWE-bench で 72.5%、Terminal-bench では 43.2% と非常に高水準のスコアを記録しています。集中的な作業と多くのステップを要する長時間タスクにおいて、持続的なパフォーマンスを発揮します。
Anthrcopic のページでは、次のように紹介されています。
Claude Opus 4 is our most powerful model yet and the best coding model in the world, leading on SWE-bench (72.5%) and Terminal-bench (43.2%). It delivers sustained performance on long-running tasks that require focused effort and thousands of steps, with the ability to work continuously for several hours—dramatically outperforming all Sonnet models and significantly expanding what AI agents can accomplish.
ナレッジカットオフは 2025年3月です。
Claude Sonnet 4
もう 1 つ、Claude 4 シリーズでモデルが登場しています。
Claude Sonnet 4は、SWE-bench が 72.7% と高いコーディング性能を誇っています。SWE-bench の観点では Claude Opus 4 に勝っていますが、Anthrcopic のページでは、ほとんどのケースでは Claude Opus 4 が勝ると記載されています。
Claude Sonnet 4 significantly improves on Sonnet 3.7's industry-leading capabilities, excelling in coding with a state-of-the-art 72.7% on SWE-bench. The model balances performance and efficiency for internal and external use cases, with enhanced steerability for greater control over implementations. While not matching Opus 4 in most domains, it delivers an optimal mix of capability and practicality.
ナレッジカットオフは2024年10月です。
コンテキストウィンドウ/出力トークン数
どちらも 200 万トークンのコンテキストウィンドウをサポートしています。最大出力トークン数は Sonnet 4 で 64,000 トークン、Opus 4 は 32,000 トークンとなっています。
Extended Thinking
Claude 3.7 で出てきた拡張思考 (Extended Thinking) は Claude 4 でも健在でした。
Claude Opus 4 and Sonnet 4 are hybrid models offering two modes: near-instant responses and extended thinking for deeper reasoning. The Pro, Max, Team, and Enterprise Claude plans include both models and extended thinking, with Sonnet 4 also available to free users. Both models are available on the Anthropic API, Amazon Bedrock, and Google Cloud's Vertex AI. Pricing remains consistent with previous Opus and Sonnet models: Opus 4 at $15/$75 per million tokens (input/output) and Sonnet 4 at $3/$15.
ただし、Extended Thinking の出力内容が、変わってきています。
今まで Claude 3.7 の Extended Thinking では、思考の全文が出力されていましたが、Claude 4 からは思考が要約された内容が出力されるようになっています。
なお、Claude 3.7 のように、思考の全文が欲しい場合は Anthropic 側に問い合わせを行えば確認できるようです。
Users requiring raw chains of thought for advanced prompt engineering can contact sales about our new Developer Mode to retain full access.
AWS 側もアカウントチームの問い合わせで利用できそうです。
To access the full thinking output for Claude 4 models, contact your account team.
インターリープ思考 (beta)
Claude 4 から、新たにインターリープ思考
という機能が増えています。
これは、ツール呼び出しの間に思考プロセスを挟むといった機能です。たとえば、ツールの結果から次に何をするか(何のツールを呼び出すか)を思考するようなことができます。anthropic-betaヘッダーに interleaved-thinking-2025-05-14
を含めることで切り替えられます。
プロンプトエンジニアリングのベストプラクティス
モデルの公開に合わせ、Claude 4 向けのプロンプトエンジニアリングのベストプラクティスガイドが公開されています。
個人的には ビジュアルおよびフロントエンドコード生成の強化
で取り上げられたプロンプトの内容が「ほぇぇ
」となりました。(人間みたいですね)
遠慮せずに、全力を尽くしてください。
移行に際して
Claude 3.7 から Claude 4 への移行ガイドも紹介されています。合わせて読んでおくと良いかもしれません。
Amazon Bedrock との統合
続いて Amazon Bedrock との統合に触れていきます。
Supported foundation models in Amazon Bedrock によると、次のリージョンで推論プロファイル経由で利用可能になります。なんと、東京リージョンでも Claude Sonnet 4 が利用できます。
Claude Opus 4
- us-east-1
- us-east-2
- us-west-2
Claude Sonnet 4
- us-east-1
- us-east-2
- us-west-2
- ap-northeast-1
- ap-northeast-2
- ap-northeast-3
- ap-south-1
- ap-south-2
- ap-southeast-1
- ap-southeast-2
- eu-south-2
機能
Model support by feature をみてみます。
残念ながら、現状は他の機能との統合は行われていないようでした。
Tool Use
続いて Tool Use です。Claude 4 への移行ガイドでも紹介されている通り、ツールの名前が異なります。
Claude 3.7 Sonnet の世界で str_replace_editor
だったものは str_replace_based_edit_tool
になりました。
Extended Thinking/Interleaved Thinking (beta)
Amazon Bedrock でもサポート対象です。トークン数に注意しながらガンガン使っていきましょう。
アプリケーション推論プロファイル
アプリケーション推論プロファイルを作成可能です。(コスト管理担当の方にはありがたいですね)
クォーター
Service Quotas(バージニア北部)を確認すると、アカウントレベルのデフォルト値は以下の値が設定されていました。割と大きめに設定されていますね。
- Cross-region model inference requests per minute for Anthropic Claude Opus 4 V1
- 200
- Cross-region model inference tokens per minute for Anthropic Claude Opus 4 V1
- 200,000
- Model invocation max tokens per day for Anthropic Claude Opus 4 V1
- 10,000,000
- Cross-region model inference requests per minute for Anthropic Claude Sonnet 4 V1
- 200
- Cross-region model inference tokens per minute for Anthropic Claude Sonnet 4 V1
- 200,000
- Model invocation max tokens per day for Anthropic Claude Sonnet 4 V1
- 10,000,000
コスト
最後にコストです。Claude Opus 4 と Claude 3 Opus が同価格、Claude Sonnet 4 と Claude 3.7 Sonnet が同価格となっていました。ありがたいですね。
Anthropic models | Price per 1,000 input tokens | Price per 1,000 output tokens | Price per 1,000 input tokens (batch) | Price per 1,000 output tokens (batch) | Price per 1,000 input tokens (cache write) | Price per 1,000 input tokens (cache read) |
---|---|---|---|---|---|---|
Claude Opus 4*** | $0.015 | $0.075 | NA | NA | $0.01875 | $0.0015 |
Claude Sonnet 4*** | $0.003 | $0.015 | NA | NA | $0.00375 | $0.0003 |
まとめ
以上、「Amazon Bedrock で Claude Sonnet 4, Claude Opus 4 が利用可能になったため、概要をまとめてみた」でした。東京リージョンでも推論プロファイルを利用して利用可能になったのはありがたいですね。
クラウド事業本部コンサルティング部のたかくに(@takakuni_)でした!