Amazon BedrockのClaude 4.5 Sonnetを日本国内だけで実行する方法
データレジデンシー要件などから、生成AIモデルの実行を日本国内に限定したいケースが増えています。
Amazon Bedrockでは、最新の Claude 4.5 Sonnet を利用することで、この要件を簡単に満たすことができます。
本記事では、旧モデルからの移行や新規での利用を想定し、Claude 4.5 Sonnetを日本国内で実行するための 推論プロファイル の使い方を解説します。
背景
最近のモデルは推論プロファイルで呼び出す
Claude 3.5 Sonnet(v1) のような古いモデルは、リージョンとモデルIDを直接指定して日本国内で呼び出せました。
import boto3
bedrock = boto3.client("bedrock-runtime")
MODEL_ID = "anthropic.claude-3-5-sonnet-20240620-v1:0" # モデルIDを直接指定
response = bedrock.converse(
modelId=MODEL_ID,
messages=[{"role": "user", "content": [{"text": "Who are you?"}]}],
)
for content in response["output"]["message"]["content"]:
print(content["text"])
Claude Sonnet 4.5 のような最近の基盤モデルを利用する場合、モデルIDだけを最新のもの(例 anthropic.claude-sonnet-4-5-20250929-v1:0
)に変更すると、 推論プロファイル を使うよう促すエラーが表示されます。
ValidationException
An error occurred (ValidationException) when calling the Converse operation: Invocation of model ID anthropic.claude-sonnet-4-20250514-v1:0 with on-demand throughput isn’t supported. Retry your request with the ID or ARN of an inference profile that contains this model.
クロスリージョン推論はリージョンを限定するのが難しい
この 推論プロファイル は、どのモデルとどのリージョン群で実行するかを定義したAmazon Bedrockのリソースです。AWSはこのような推論プロファイルをあらかじめ用意しており、以下の様な用途で使われます。
- 使用状況のメトリクス
- コスト配分タグ
- クロスリージョン推論
最後の クロスリージョン推論 はモデル実行を複数のリージョンにルーティングしてスループットとパフォーマンスを向上させるためのものです。
このクロスリージョン推論プロファイルを利用すると、呼び出し元のリージョンでモデルアクセスを有効化するだけで、グルーピングされた全てのリージョンが呼び出し対象となってしまいます。許可リストや拒否リストのように、特定のリージョンだけを対象とする機能は提供されていません。
Amazon Bedrock クロスリージョン推論の理解を深める | DevelopersIO
Claude Sonnet 4.5 以前のモデルでは、日本国内に閉じたプロファイルは存在しませんでした。
利用できたのは、下記リージョン一覧のようなアジア太平洋(APAC)の APAC Claude Sonnet 4 のような推論プロファイルのみで、前述の仕様から、日本国内だけで実行させるためには別途工夫が求められました。
- ap-northeast-1(東京)
- ap-northeast-2(韓国)
- ap-northeast-3(大阪)
- ap-south-1(ムンバイ)
- ap-south-2(ハイデラバード)
- ap-southeast-1(シンガポール)
- ap-southeast-2(シドニー)
- ap-southeast-4(メルボルン)
Claude Sonnet 4.5から日本国内向けクロスリージョン推論に対応
Claude Sonnet 4.5 からは、日本国内に閉じたプロファイル(JP Anthropic Claude Sonnet 4.5) が誕生し、JP のプリフィックスの通り、以下の 国内リージョンにのみルーティング され、簡単に日本国内実行の要件を実現できるようになりました
- ap-northeast-1(東京)
- ap-northeast-3(大阪)
やってみる
モデル Claude Sonnet 4.5 に対して 日本国内クロスリージョン推論プロファイル の「JP Anthropic Claude Sonnet 4.5」を呼び出したのが、以下のコードです
import boto3
bedrock = boto3.client("bedrock-runtime")
MODEL_ID = "jp.anthropic.claude-sonnet-4-5-20250929-v1:0" # 日本国内クロスリージョン推論プロファイル
response = bedrock.converse(
modelId=MODEL_ID,
messages=[{"role": "user", "content": [{"text": "Who are you?"}]}],
)
for content in response["output"]["message"]["content"]:
print(content["text"])
まとめ
データレジデンシーやコンプライアンス要件等により、日本国内でモデルを実行することが求められるケースがあります。
Amazon Bedrockを利用する場合、 Claude Sonnet 4.5 モデルに対して 日本国内向けのクロスリージョン推論プロファイル 「JP Anthropic Claude Sonnet 4.5」を指定することで、簡単に日本国内でモデル実行できます。
- Claude Sonnet 3.5 v1のようなモデルID指定から推論プロファイル指定方式への移行
- 新規採用
どちらでも問題なく使えます。