Amazon Bedrock クロスリージョン推論の理解を深める

Amazon Bedrock クロスリージョン推論の理解を深める

Clock Icon2025.06.06

こんにちは、@TakaakiKakei です。

今回は「Amazon Bedrock クロスリージョン推論」について改めて調査したので、その内容を共有します。

Amazon Bedrock クロスリージョン推論

「Amazon Bedrock クロスリージョン推論」(以降、クロスリージョン推論)は、Amazon Bedrockの機能で、複数のAWSリージョン間でトラフィックを動的にルーティングします。これにより、ユーザーは各リクエストに最適な可用性を確保でき、使用率の高い時間帯のパフォーマンスを向上させることができます。

サポート対象のモデルとリージョンの定義は、以下の公式ドキュメントで確認できます。

Supported Regions and models for inference profiles - Amazon Bedrock

サポートリージョン

クロスリージョン推論は、モデルごとにいくつかのセクションで提供されています。たとえば、Claude Sonnet 4の場合は、以下の通りです。
クロスリージョン推論で東京リージョンや大阪リージョンを利用する場合、APACセクションの選択が必要です。

  • USセクション(ID:us.anthropic.claude-sonnet-4-20250514-v1:0)
  • EUセクション(ID:eu.anthropic.claude-sonnet-4-20250514-v1:0)
  • APACセクション(ID:apac.anthropic.claude-sonnet-4-20250514-v1:0)

送信元と送信先の概念

クロスリージョン推論には、送信元と送信先の概念があります。クロスリージョン推論では、送信元と送信先を意識することが重要です。

  • 送信元:リクエストを送信するリージョン(ユーザーが実際にAPIを呼び出すリージョン。開発時はクライアントを作成する際のリージョン。)
  • 送信先:実際にモデルが実行されるリージョン(負荷分散により自動選択される)

サポートリージョンの対応関係

Claude Sonnet 4のクロスリージョン推論を利用する際、送信元を東京リージョン(ap-northeast-1)に設定した場合、送信先として以下のAPACセクションのリージョンが利用されます。

  • ap-northeast-1(東京)
  • ap-northeast-2(韓国)
  • ap-northeast-3(大阪)
  • ap-south-1(ムンバイ)
  • ap-south-2(ハイデラバード)
  • ap-southeast-1(シンガポール)
  • ap-southeast-2(シドニー)
  • ap-southeast-4(メルボルン)

Supported Regions and models for inference profiles - Amazon Bedrock(再掲)

CleanShot 2025-06-05 at 10.19.00.png

モデル有効化の要件

公式ドキュメントでの明記は見受けられませんが、モデルの有効化作業は「送信元のリージョン」でのみ行えば良いようです。送信先のリージョンでモデルを有効化しなくても、自動的にクロスリージョン推論が行われるようです。以下のブログで、その挙動が確認できます。逆に言うと、送信先のモデルを無効化することでクロスリージョン推論を制御できないことも意味します。

Amazon Bedrock がクロスリージョン推論(モデル実行)をサポートしました | DevelopersIO

リクエストの取り扱い

Cross-Region inference requests are kept within the AWS Regions that are part of the geography where the data originally resides. For example, a request made within the US is kept within the AWS Regions in the US. Although the data remains stored only in the source Region, your input prompts and output results might move outside of your source Region during cross-Region inference. All data will be transmitted encrypted across Amazon's secure network.

Increase throughput with cross-Region inference - Amazon Bedrock

クロスリージョン推論のリクエストは以下のように取り扱われます。

  • イベント情報などは送信元のリージョンに記録・保持される
  • 処理中は入力プロンプトと出力結果が送信元リージョン外に移動する可能性がある
  • すべてのデータ転送はAmazonの安全なネットワークで暗号化される

以下に、東京リージョンでクロスリージョン推論を利用した際の実際の動作を確認する手順を示します。

  1. AWS Management Consoleにログインし、東京リージョンのAmazon Bedrockのサービス画面を開きます。
  2. 左側のメニューから「プレイグラウンド」の「Chat / Text」を選択します。
  3. モデルの選択画面で、クロスリージョン推論対応モデル(例: 事前にモデル有効化したClaude Sonnet 4)を選択します。
  4. 「プロンプト」欄に任意のテキストを入力し、会話を行います。
  5. 実行後、東京リージョンのCloudTrailで、イベントが記録されていることを確認できました。

CleanShot 2025-06-06 at 09.44.59@2x.png

この結果から、実際の処理がどのリージョンで行われても、イベント情報などは送信元のリージョン(この場合は東京)に保持されることが確認できました。

CleanShot 2025-06-06 at 10.53.55@2x.png

またイベントの詳細を確認すると、リクエストが実際にどこのリージョンで処理されたかを確認することができます。inferenceRegionが実際にモデルが実行されたリージョンを示しています。

おわりに

最後までお読みいただき、ありがとうございます。

クロスリージョン推論は、AWSのグローバルなインフラストラクチャを活用して、より効率的なモデル推論を実現するための強力な機能です。特に、複数のリージョンでの可用性とパフォーマンスを向上させることができる点が魅力的です。この機能を活用することで、本番環境でのAI活用がよりスムーズになるので、積極的に利用していきたいですね。

それではまた!

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.