BedrockのOpenAIモデル（GPT-5.5 / GPT-5.4）がus-east-1で利用可能になったので試してみた

Amazon Bedrock上のGPT-5.5 / GPT-5.4がus-east-1（バージニア北部）で利用可能になりました。SCP制限でオハイオが使えない環境でも利用でき、Responses APIストリーミングのTTFTなども検証しています。

suzuki.ryo

2026.06.11

 はじめにAmazon Bedrockで提供されているOpenAIのGPT-5.5 / GPT-5.4が、us-east-1（バージニア北部）で利用可能になりました。
https://aws.amazon.com/jp/about-aws/whats-new/2026/06/openai-gpt-us-east-virginia-amazon/
2026年6月11日時点でのリージョン対応状況は以下のとおりです（GovCloud除く）。
GPT-5.5（openai.gpt-5.5）


リージョン
対応


us-east-1 (N. Virginia)
✅ New

us-east-2 (Ohio)
✅

GPT-5.4（openai.gpt-5.4）


リージョン
対応


us-east-1 (N. Virginia)
✅ New

us-east-2 (Ohio)
✅

us-west-2 (Oregon)
✅

最新情報は公式ドキュメントを確認してください。
本記事では、us-east-1でGPT-5.5 / GPT-5.4が動作することを確認しました。加えてResponses APIのstream=Trueによるストリーミングのイベント構造やTTFT（Time to First Token）を検証しています。
認証・セットアップ手順は前回の記事を参照してください。
https://dev.classmethod.jp/articles/bedrock-openai-gpt55-gpt54-ga-responses-api/
 検証環境

項目
内容


リージョン
us-east-1

エンドポイント
https://bedrock-mantle.us-east-1.api.aws/openai/v1

モデル
openai.gpt-5.5、openai.gpt-5.4

Python
3.14.x

openai SDK
2.40.0

認証
aws-bedrock-token-generator 1.1.0

すべての呼び出しで reasoning.effort = "low" を指定しています。高effortでの重複・JSON破損の回避策については以下の記事を参照してください。
https://dev.classmethod.jp/articles/bedrock-gpt55-high-effort-duplicate-json-corruption-workaround/
 Responses API 非ストリームでの動作確認まず、stream なしの通常呼び出しでus-east-1での動作を確認します。
from openai import OpenAI
from aws_bedrock_token_generator import BedrockTokenGenerator

token_generator = BedrockTokenGenerator(region="us-east-1")
client = OpenAI(
    base_url="https://bedrock-mantle.us-east-1.api.aws/openai/v1",
    api_key=token_generator(),
)

response = client.responses.create(
    model="openai.gpt-5.5",
    input="Explain Amazon Bedrock in one sentence.",
    reasoning={"effort": "low"},
)
print(response.output_text)
print(f"Usage: input={response.usage.input_tokens}, output={response.usage.output_tokens}")
 結果

モデル
レイテンシ
Input tokens
Output tokens
Reasoning tokens


GPT-5.5
23.55s
28
37
0

GPT-5.4
41.52s
28
37
0

GPT-5.5の出力例：
Amazon Bedrock is a fully managed AWS service that lets you build and scale generative AI applications using foundation models from Amazon and leading AI providers via a single API.
両モデルともus-east-1で正常に動作しました。
レイテンシは1回の測定値であり、実行ごとにばらつきがあります。傾向の参考値としてご覧ください。
 Responses API ストリーミングimport time
from openai import OpenAI
from aws_bedrock_token_generator import BedrockTokenGenerator

token_generator = BedrockTokenGenerator(region="us-east-1")
client = OpenAI(
    base_url="https://bedrock-mantle.us-east-1.api.aws/openai/v1",
    api_key=token_generator(),
)

start = time.time()
first_token_time = None
full_text = ""

stream = client.responses.create(
    model="openai.gpt-5.5",
    input="Amazon Bedrock の主な特徴を3つ挙げてください。",
    reasoning={"effort": "low"},
    stream=True,
)

for event in stream:
    if event.type == "response.output_text.delta":
        if first_token_time is None:
            first_token_time = time.time()
        full_text += event.delta
    elif event.type == "response.completed":
        usage = event.response.usage

elapsed = time.time() - start
ttft = first_token_time - start if first_token_time else None

print(f"TTFT: {ttft:.2f}s")
print(f"Total: {elapsed:.2f}s")
print(f"Usage: input={usage.input_tokens}, output={usage.output_tokens}")
print(full_text)
 イベント構造今回のテキスト応答では、以下の順序でイベントが流れてきました。
response.created
→ response.in_progress
→ response.output_item.added
→ response.content_part.added
→ response.output_text.delta（N回繰り返し）
→ response.output_text.done
→ response.content_part.done
→ response.output_item.done
→ response.completed
テキストの取得は response.output_text.delta イベントの event.delta を連結します。正常完了時のusageは、最後の response.completed イベントの event.response.usage から取得できました。
 結果

モデル
レイテンシ
TTFT
Input tokens
Output tokens
Reasoning tokens


GPT-5.5
22.30s
1.35s
35
132
0

GPT-5.4
33.70s
0.95s
34
122
0

非ストリームの検証とは入力プロンプトが異なる（日本語の別質問を使用）ため、Input tokens数も異なります。
GPT-5.5の出力例：
Amazon Bedrock の主な特徴は以下の3つです。
複数の基盤モデルを利用可能

AmazonやAnthropic、MetaなどのさまざまなAIモデルを選んで利用できます。
サーバーレスで利用できる

インフラ管理なしで、API経由で生成AIアプリケーションを構築できます。
AWSサービスとの統合とセキュリティ

IAMやVPC、CloudWatchなどAWSの機能と連携し、安全に運用できます。
TTFTはGPT-5.4が0.95s、GPT-5.5が1.35sでした。今回の検証では、総レイテンシが22〜34秒だった一方でTTFTは1秒前後となり、早い段階で最初のテキスト表示を開始できました。
 Chat Completions API は GPT-5.5 / GPT-5.4 で非対応GPT-5.5 / GPT-5.4ではChat Completions API（/v1/chat/completions）は対応していません。実際に呼び出すと400エラーが返されました。
# これは動作しない
response = client.chat.completions.create(
    model="openai.gpt-5.5",
    messages=[{"role": "user", "content": "Hello"}],
    max_tokens=256,
)
openai.BadRequestError: Error code: 400 - {
  "error": {
    "code": "validation_error",
    "message": "The model 'openai.gpt-5.5' does not support the '/v1/chat/completions' API",
    "param": null,
    "type": "invalid_request_error"
  }
}
GPT-5.4でも同様のエラーとなります。AWSブログの更新欄（2026年6月1日付）にも「Responses API only」と記載されており、本記事執筆時点ではこれらのモデルはResponses APIのみの対応です。
 まとめ日本国内向けのワークロードを運用するAWSアカウントでは、SCPによるリージョン制限で東京・大阪・バージニアのみ許可しオハイオは制限対象とするケースが多くあります。このような環境でもus-east-1対応によってBedrock上のOpenAIモデルを利用可能になりました。
https://classmethod.jp/news/240805-secure-account/
リージョン拡大に加え、6/1時点では未提供だったコンソール対応もリリースされています。
https://dev.classmethod.jp/articles/bedrock-mantle-console-gpt55/
Bedrock上のOpenAI環境の整備が進んでいるので、引き続き注目していきたいと思います。
 参考リンクSupported OpenAI models in Amazon Bedrock
Amazon Bedrock Pricing
OpenAI Responses API Reference

BedrockのOpenAIモデル（GPT-5.5 / GPT-5.4）がus-east-1で利用可能になったので試してみた

はじめに

検証環境

Responses API 非ストリームでの動作確認

結果

Responses API ストリーミング

イベント構造

結果

Chat Completions API は GPT-5.5 / GPT-5.4 で非対応

まとめ

参考リンク

AI白書2026 配布中

関連記事

AWSで探す

注目のテーマ

プロダクトやサービスで探す

特集やシリーズから探す

EVENTS

リージョン	対応
us-east-1 (N. Virginia)	✅ New
us-east-2 (Ohio)	✅
us-west-2 (Oregon)	✅

項目	内容
リージョン	us-east-1
エンドポイント	`https://bedrock-mantle.us-east-1.api.aws/openai/v1`
モデル	`openai.gpt-5.5`、`openai.gpt-5.4`
Python	3.14.x
openai SDK	2.40.0
認証	aws-bedrock-token-generator 1.1.0