BedrockのOpenAIモデル(GPT-5.5 / GPT-5.4)がus-east-1で利用可能になったので試してみた
はじめに
Amazon Bedrockで提供されているOpenAIのGPT-5.5 / GPT-5.4が、us-east-1(バージニア北部)で利用可能になりました。
2026年6月11日時点でのリージョン対応状況は以下のとおりです(GovCloud除く)。
GPT-5.5(openai.gpt-5.5)
| リージョン | 対応 |
|---|---|
| us-east-1 (N. Virginia) | ✅ New |
| us-east-2 (Ohio) | ✅ |
GPT-5.4(openai.gpt-5.4)
| リージョン | 対応 |
|---|---|
| us-east-1 (N. Virginia) | ✅ New |
| us-east-2 (Ohio) | ✅ |
| us-west-2 (Oregon) | ✅ |
最新情報は公式ドキュメントを確認してください。
本記事では、us-east-1でGPT-5.5 / GPT-5.4が動作することを確認しました。加えてResponses APIのstream=Trueによるストリーミングのイベント構造やTTFT(Time to First Token)を検証しています。
認証・セットアップ手順は前回の記事を参照してください。
検証環境
| 項目 | 内容 |
|---|---|
| リージョン | us-east-1 |
| エンドポイント | https://bedrock-mantle.us-east-1.api.aws/openai/v1 |
| モデル | openai.gpt-5.5、openai.gpt-5.4 |
| Python | 3.14.x |
| openai SDK | 2.40.0 |
| 認証 | aws-bedrock-token-generator 1.1.0 |
すべての呼び出しで reasoning.effort = "low" を指定しています。高effortでの重複・JSON破損の回避策については以下の記事を参照してください。
Responses API 非ストリームでの動作確認
まず、stream なしの通常呼び出しでus-east-1での動作を確認します。
from openai import OpenAI
from aws_bedrock_token_generator import BedrockTokenGenerator
token_generator = BedrockTokenGenerator(region="us-east-1")
client = OpenAI(
base_url="https://bedrock-mantle.us-east-1.api.aws/openai/v1",
api_key=token_generator(),
)
response = client.responses.create(
model="openai.gpt-5.5",
input="Explain Amazon Bedrock in one sentence.",
reasoning={"effort": "low"},
)
print(response.output_text)
print(f"Usage: input={response.usage.input_tokens}, output={response.usage.output_tokens}")
結果
| モデル | レイテンシ | Input tokens | Output tokens | Reasoning tokens |
|---|---|---|---|---|
| GPT-5.5 | 23.55s | 28 | 37 | 0 |
| GPT-5.4 | 41.52s | 28 | 37 | 0 |
GPT-5.5の出力例:
Amazon Bedrock is a fully managed AWS service that lets you build and scale generative AI applications using foundation models from Amazon and leading AI providers via a single API.
両モデルともus-east-1で正常に動作しました。
レイテンシは1回の測定値であり、実行ごとにばらつきがあります。傾向の参考値としてご覧ください。
Responses API ストリーミング
import time
from openai import OpenAI
from aws_bedrock_token_generator import BedrockTokenGenerator
token_generator = BedrockTokenGenerator(region="us-east-1")
client = OpenAI(
base_url="https://bedrock-mantle.us-east-1.api.aws/openai/v1",
api_key=token_generator(),
)
start = time.time()
first_token_time = None
full_text = ""
stream = client.responses.create(
model="openai.gpt-5.5",
input="Amazon Bedrock の主な特徴を3つ挙げてください。",
reasoning={"effort": "low"},
stream=True,
)
for event in stream:
if event.type == "response.output_text.delta":
if first_token_time is None:
first_token_time = time.time()
full_text += event.delta
elif event.type == "response.completed":
usage = event.response.usage
elapsed = time.time() - start
ttft = first_token_time - start if first_token_time else None
print(f"TTFT: {ttft:.2f}s")
print(f"Total: {elapsed:.2f}s")
print(f"Usage: input={usage.input_tokens}, output={usage.output_tokens}")
print(full_text)
イベント構造
今回のテキスト応答では、以下の順序でイベントが流れてきました。
response.created
→ response.in_progress
→ response.output_item.added
→ response.content_part.added
→ response.output_text.delta(N回繰り返し)
→ response.output_text.done
→ response.content_part.done
→ response.output_item.done
→ response.completed
テキストの取得は response.output_text.delta イベントの event.delta を連結します。正常完了時のusageは、最後の response.completed イベントの event.response.usage から取得できました。
結果
| モデル | レイテンシ | TTFT | Input tokens | Output tokens | Reasoning tokens |
|---|---|---|---|---|---|
| GPT-5.5 | 22.30s | 1.35s | 35 | 132 | 0 |
| GPT-5.4 | 33.70s | 0.95s | 34 | 122 | 0 |
非ストリームの検証とは入力プロンプトが異なる(日本語の別質問を使用)ため、Input tokens数も異なります。
GPT-5.5の出力例:
Amazon Bedrock の主な特徴は以下の3つです。
複数の基盤モデルを利用可能
AmazonやAnthropic、MetaなどのさまざまなAIモデルを選んで利用できます。サーバーレスで利用できる
インフラ管理なしで、API経由で生成AIアプリケーションを構築できます。AWSサービスとの統合とセキュリティ
IAMやVPC、CloudWatchなどAWSの機能と連携し、安全に運用できます。
TTFTはGPT-5.4が0.95s、GPT-5.5が1.35sでした。今回の検証では、総レイテンシが22〜34秒だった一方でTTFTは1秒前後となり、早い段階で最初のテキスト表示を開始できました。
Chat Completions API は GPT-5.5 / GPT-5.4 で非対応
GPT-5.5 / GPT-5.4ではChat Completions API(/v1/chat/completions)は対応していません。実際に呼び出すと400エラーが返されました。
# これは動作しない
response = client.chat.completions.create(
model="openai.gpt-5.5",
messages=[{"role": "user", "content": "Hello"}],
max_tokens=256,
)
openai.BadRequestError: Error code: 400 - {
"error": {
"code": "validation_error",
"message": "The model 'openai.gpt-5.5' does not support the '/v1/chat/completions' API",
"param": null,
"type": "invalid_request_error"
}
}
GPT-5.4でも同様のエラーとなります。AWSブログの更新欄(2026年6月1日付)にも「Responses API only」と記載されており、本記事執筆時点ではこれらのモデルはResponses APIのみの対応です。
まとめ
日本国内向けのワークロードを運用するAWSアカウントでは、SCPによるリージョン制限で東京・大阪・バージニアのみ許可しオハイオは制限対象とするケースが多くあります。このような環境でもus-east-1対応によってBedrock上のOpenAIモデルを利用可能になりました。
リージョン拡大に加え、6/1時点では未提供だったコンソール対応もリリースされています。
Bedrock上のOpenAI環境の整備が進んでいるので、引き続き注目していきたいと思います。





