[アップデート] Anthropic Claude 3.7 Sonnet が東京、大阪リージョンを含む、 APAC の推論プロファイルで利用可能になりました
こんにちは!クラウド事業本部コンサルティング部のたかくに(@takakuni_)です。
What's New やドキュメントに出てきていないですが、 Anthropic Claude 3.7 Sonnet が東京、大阪リージョンを含む、 APAC の推論プロファイルで利用可能になりました。
アップデート内容
今回のアップデートは、APAC の推論プロファイルに Anthropic Claude 3.7 Sonnet が登場したというアップデートです。
マネジメントコンソールから、推論プロファイル ID は apac.anthropic.claude-3-7-sonnet-20250219-v1:0
となっています。
じきに以下のドキュメントも更新されると思われます。
ap-northeast-3
推論プロファイルの AWS Regions に大阪リージョン(ap-northeast-3
)が記載されています。
大阪リージョンもサポートしたということなのでしょうか。
やってみる
それでは、東京、大阪リージョンで Anthropic Claude 3.7 Sonnet の推論プロファイルを利用してみたいと思います。
まずは、各々のリージョンでモデルアクセスの有効化を行います。
東京リージョン
大阪リージョン
プレイグラウンドで推論
プレイグラウンド(マネジメントコンソール)で推論してみます。東京リージョンおよび、大阪リージョンで Claude 3.7 Sonnet を推論プロファイル経由で呼び出しできていますね。
ログを見てみる
推論プロファイルは機能の性質上、API 実行元リージョンとは異なるリージョンで、推論が行われる可能性があります。
どこで推論が行われたのかは CloudTrail(のデータイベント)または、Bedrock 独自のモデル呼び出しログ記録
で閲覧できます。
今回は モデル呼び出しログ記録
を各リージョンで有効化し、推論先リージョンを調べてみます。
東京リージョン
以下は東京リージョンの CloudWatch Logs で記録されたモデル呼び出しログ記録
です。
inferenceRegion
にある通り、東京リージョン(ap-northeast-1
)で呼び出しが発生していることがわかります。
推論プロファイル経由で、東京リージョンで呼び出し、推論も東京リージョンで行われたということです。
{
"schemaType": "ModelInvocationLog",
"schemaVersion": "1.0",
"timestamp": "2025-05-22T12:29:12Z",
"accountId": "123456789012",
"identity": {
"arn": "arn:aws:sts::123456789012:assumed-role/takakuni/takakuni"
},
"region": "ap-northeast-1",
"requestId": "19eeeed4-e1bc-4f5c-99a5-73163721111e",
"operation": "ConverseStream",
"modelId": "arn:aws:bedrock:ap-northeast-1:123456789012:inference-profile/apac.anthropic.claude-3-7-sonnet-20250219-v1:0",
"input": {
"inputContentType": "application/json",
"inputBodyJson": {
"messages": [
{
"role": "user",
"content": [
{
"text": "こんにちは!Claude 3.7 Sonnet さん\n東京で美味しい夜ご飯が食べたいです。名物は何ですか?"
}
]
}
],
"inferenceConfig": {
"maxTokens": 2048,
"temperature": 1,
"topP": 0.999,
"stopSequences": []
},
"additionalModelRequestFields": {
"reasoning_config": {
"type": "disabled"
}
}
},
"inputTokenCount": 53,
"cacheReadInputTokenCount": 0,
"cacheWriteInputTokenCount": 0
},
"output": {
"outputContentType": "application/json",
"outputBodyJson": {
"output": {
"message": {
"role": "assistant",
"content": [
{
"text": "こんにちは!東京で美味しい夜ご飯をお探しなのですね。東京には様々な名物料理があります:\n\n**東京の名物料理**:\n- **寿司** - 特に築地市場や豊洲市場周辺の店舗は新鮮な魚介類を使った寿司が楽しめます\n- **もんじゃ焼き** - 月島エリアが有名で、粘り気のある独特の食感が特徴です\n- **天ぷら** - 軽い衣で揚げた季節の野菜や魚介類を楽しめます\n- **深川飯** - あさりの旨味が効いた江戸の伝統料理です\n- **東京ラーメン** - 昔ながらの醤油ベースのスープが特徴です\n\n他にも、とんかつ、うなぎ、おでん、すき焼きなども東京で人気があります。何か特に好みの料理ジャンルはありますか?予算やエリアなどお決まりでしたら、もう少し具体的なおすすめができます。"
}
]
}
},
"stopReason": "end_turn",
"metrics": {
"latencyMs": 7015
},
"usage": {
"inputTokens": 53,
"outputTokens": 335,
"totalTokens": 388
}
},
"outputTokenCount": 335
},
"inferenceRegion": "ap-northeast-1"
}
大阪リージョン
続いて、大阪リージョンです。
こちらも inferenceRegion
にある通り、東京リージョン(ap-northeast-1
)で呼び出しが発生していることがわかります。
推論プロファイル経由で、大阪リージョンで呼び出し、推論は東京リージョンで行われたということです。
このように推論プロファイル経由のモデル推論は、呼び出し元と推論元のリージョンの一致を保証するものではないことがわかります。ご注意ください。
{
"schemaType": "ModelInvocationLog",
"schemaVersion": "1.0",
"timestamp": "2025-05-22T12:28:23Z",
"accountId": "123456789012",
"identity": {
"arn": "arn:aws:sts::123456789012:assumed-role/takakuni/takakuni"
},
"region": "ap-northeast-3",
"requestId": "205f0ab4-3d55-4e06-9de3-6d84e286f6c5",
"operation": "ConverseStream",
"modelId": "arn:aws:bedrock:ap-northeast-3:123456789012:inference-profile/apac.anthropic.claude-3-7-sonnet-20250219-v1:0",
"input": {
"inputContentType": "application/json",
"inputBodyJson": {
"messages": [
{
"role": "user",
"content": [
{
"text": "こんにちは!Claude 3.7 Sonnet さん\n大阪で美味しい夜ご飯が食べたいです。名物は何ですか?"
}
]
}
],
"inferenceConfig": {
"maxTokens": 2048,
"temperature": 1,
"topP": 0.999,
"stopSequences": []
},
"additionalModelRequestFields": {
"reasoning_config": {
"type": "disabled"
}
}
},
"inputTokenCount": 54,
"cacheReadInputTokenCount": 0,
"cacheWriteInputTokenCount": 0
},
"output": {
"outputContentType": "application/json",
"outputBodyJson": {
"output": {
"message": {
"role": "assistant",
"content": [
{
"text": "こんにちは!大阪の美味しい夜ご飯についてご質問いただきありがとうございます。\n\n大阪は「食いだおれの街」として知られ、多くの名物料理があります:\n\n**大阪の有名な名物料理:**\n- **たこ焼き** - 外はカリッと中はトロトロの大阪の代表的なストリートフード\n- **お好み焼き** - キャベツなどの具材と生地を鉄板で焼く「大阪風」は具材と生地を混ぜて焼くのが特徴\n- **串カツ** - 様々な具材を串に刺して衣をつけて揚げたもの(二度づけ禁止!)\n- **どて焼き** - 牛スジ肉を甘辛い味噌で煮込んだ料理\n- **くいだおれ横丁・道頓堀** - 有名な飲食店街で多くの名物が楽しめます\n- **粉もん料理** - 大阪は小麦粉を使った料理が豊富(たこ焼き、お好み焼き、うどんなど)\n- **551蓬莱の豚まん** - 地元で愛される肉まん\n\n**夜ご飯におすすめのエリア:**\n- 道頓堀・なんば(多くの飲食店が集まる観光地)\n- 新世界(串カツやホルモン料理が有名)\n- 天満(庶民的な美味しい店が多い)\n- 北新地(高級店からカジュアルな店まで様々)\n\nどのようなタイプの料理や価格帯をお望みですか?もう少し具体的なおすすめができますよ。"
}
]
}
},
"stopReason": "end_turn",
"metrics": {
"latencyMs": 10742
},
"usage": {
"inputTokens": 54,
"outputTokens": 527,
"totalTokens": 581
}
},
"outputTokenCount": 527
},
"inferenceRegion": "ap-northeast-1"
}
アプリケーション推論プロファイルも作成可能
推論プロファイルといえば、コスト配分タグを付与可能なアプリケーション推論プロファイルの作成可否も気になります。
以下のコマンドを実行して Claude 3.7 Sonnet の推論プロファイルを作成してみました。
aws bedrock create-inference-profile --region 'ap-northeast-1' \
--inference-profile-name 'claude-3-7-sonnet-apac' \
--description 'claude-3-7-sonnet-apac' \
--model-source '{"copyFrom": "arn:aws:bedrock:ap-northeast-1:123456789012:inference-profile/apac.anthropic.claude-3-7-sonnet-20250219-v1:0"}' \
--tags '[{"key": "CostAllocateTag","value": "takakuni"}]'
試してみたところ、うまく作成できているようです。
~ $ aws bedrock create-inference-profile --region 'ap-northeast-1' \
> --inference-profile-name 'claude-3-7-sonnet-apac' \
> --description 'claude-3-7-sonnet-apac' \
> --model-source '{"copyFrom": "arn:aws:bedrock:ap-northeast-1:123456789012:inference-profile/apac.anthropic.claude-3-7-sonnet-20250219-v1:0"}' \
> --tags '[{"key": "CostAllocateTag","value": "takakuni"}]'
{
"inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/gmofwovgcj45",
"status": "ACTIVE"
}
~ $ aws bedrock list-inference-profiles --region 'ap-northeast-1' \
> --type-equals 'APPLICATION'
{
"inferenceProfileSummaries": [
{
"inferenceProfileName": "claude-3-7-sonnet-apac",
"description": "claude-3-7-sonnet-apac",
"createdAt": "2025-05-22T12:39:39.892195+00:00",
"updatedAt": "2025-05-22T12:39:39.892195+00:00",
"inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/gmofwovgcj45",
"models": [
{
"modelArn": "arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-3-7-sonnet-20250219-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-northeast-2::foundation-model/anthropic.claude-3-7-sonnet-20250219-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-northeast-3::foundation-model/anthropic.claude-3-7-sonnet-20250219-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-south-1::foundation-model/anthropic.claude-3-7-sonnet-20250219-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-south-2::foundation-model/anthropic.claude-3-7-sonnet-20250219-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-southeast-1::foundation-model/anthropic.claude-3-7-sonnet-20250219-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-southeast-2::foundation-model/anthropic.claude-3-7-sonnet-20250219-v1:0"
}
],
"inferenceProfileId": "gmofwovgcj45",
"status": "ACTIVE",
"type": "APPLICATION"
}
]
}
まとめ
以上、「Anthropic Claude 3.7 Sonnet が東京、大阪リージョンを含む、 APAC の推論プロファイルで利用可能になりました」でした。
推論プロファイルの性質上、推論先リージョンを縛ることはできないですが、東京リージョンで Claude 3.7 Sonnet が動いているのがなぜか嬉しいですね。
クラウド事業本部コンサルティング部のたかくに(@takakuni_)でした!