BedrockのOpenAIモデル(GPT-5.5 / GPT-5.4)がus-east-1で利用可能になったので試してみた

BedrockのOpenAIモデル(GPT-5.5 / GPT-5.4)がus-east-1で利用可能になったので試してみた

Amazon Bedrock上のGPT-5.5 / GPT-5.4がus-east-1(バージニア北部)で利用可能になりました。SCP制限でオハイオが使えない環境でも利用でき、Responses APIストリーミングのTTFTなども検証しています。
2026.06.11

はじめに

Amazon Bedrockで提供されているOpenAIのGPT-5.5 / GPT-5.4が、us-east-1(バージニア北部)で利用可能になりました。

https://aws.amazon.com/jp/about-aws/whats-new/2026/06/openai-gpt-us-east-virginia-amazon/

2026年6月11日時点でのリージョン対応状況は以下のとおりです(GovCloud除く)。

GPT-5.5(openai.gpt-5.5

リージョン 対応
us-east-1 (N. Virginia) ✅ New
us-east-2 (Ohio)

GPT-5.4(openai.gpt-5.4

リージョン 対応
us-east-1 (N. Virginia) ✅ New
us-east-2 (Ohio)
us-west-2 (Oregon)

最新情報は公式ドキュメントを確認してください。

本記事では、us-east-1でGPT-5.5 / GPT-5.4が動作することを確認しました。加えてResponses APIのstream=Trueによるストリーミングのイベント構造やTTFT(Time to First Token)を検証しています。

認証・セットアップ手順は前回の記事を参照してください。

https://dev.classmethod.jp/articles/bedrock-openai-gpt55-gpt54-ga-responses-api/

検証環境

項目 内容
リージョン us-east-1
エンドポイント https://bedrock-mantle.us-east-1.api.aws/openai/v1
モデル openai.gpt-5.5openai.gpt-5.4
Python 3.14.x
openai SDK 2.40.0
認証 aws-bedrock-token-generator 1.1.0

すべての呼び出しで reasoning.effort = "low" を指定しています。高effortでの重複・JSON破損の回避策については以下の記事を参照してください。

https://dev.classmethod.jp/articles/bedrock-gpt55-high-effort-duplicate-json-corruption-workaround/

Responses API 非ストリームでの動作確認

まず、stream なしの通常呼び出しでus-east-1での動作を確認します。

from openai import OpenAI
from aws_bedrock_token_generator import BedrockTokenGenerator

token_generator = BedrockTokenGenerator(region="us-east-1")
client = OpenAI(
    base_url="https://bedrock-mantle.us-east-1.api.aws/openai/v1",
    api_key=token_generator(),
)

response = client.responses.create(
    model="openai.gpt-5.5",
    input="Explain Amazon Bedrock in one sentence.",
    reasoning={"effort": "low"},
)
print(response.output_text)
print(f"Usage: input={response.usage.input_tokens}, output={response.usage.output_tokens}")

結果

モデル レイテンシ Input tokens Output tokens Reasoning tokens
GPT-5.5 23.55s 28 37 0
GPT-5.4 41.52s 28 37 0

GPT-5.5の出力例:

Amazon Bedrock is a fully managed AWS service that lets you build and scale generative AI applications using foundation models from Amazon and leading AI providers via a single API.

両モデルともus-east-1で正常に動作しました。

レイテンシは1回の測定値であり、実行ごとにばらつきがあります。傾向の参考値としてご覧ください。

Responses API ストリーミング

import time
from openai import OpenAI
from aws_bedrock_token_generator import BedrockTokenGenerator

token_generator = BedrockTokenGenerator(region="us-east-1")
client = OpenAI(
    base_url="https://bedrock-mantle.us-east-1.api.aws/openai/v1",
    api_key=token_generator(),
)

start = time.time()
first_token_time = None
full_text = ""

stream = client.responses.create(
    model="openai.gpt-5.5",
    input="Amazon Bedrock の主な特徴を3つ挙げてください。",
    reasoning={"effort": "low"},
    stream=True,
)

for event in stream:
    if event.type == "response.output_text.delta":
        if first_token_time is None:
            first_token_time = time.time()
        full_text += event.delta
    elif event.type == "response.completed":
        usage = event.response.usage

elapsed = time.time() - start
ttft = first_token_time - start if first_token_time else None

print(f"TTFT: {ttft:.2f}s")
print(f"Total: {elapsed:.2f}s")
print(f"Usage: input={usage.input_tokens}, output={usage.output_tokens}")
print(full_text)

イベント構造

今回のテキスト応答では、以下の順序でイベントが流れてきました。

response.created
→ response.in_progress
→ response.output_item.added
→ response.content_part.added
→ response.output_text.delta(N回繰り返し)
→ response.output_text.done
→ response.content_part.done
→ response.output_item.done
→ response.completed

テキストの取得は response.output_text.delta イベントの event.delta を連結します。正常完了時のusageは、最後の response.completed イベントの event.response.usage から取得できました。

結果

モデル レイテンシ TTFT Input tokens Output tokens Reasoning tokens
GPT-5.5 22.30s 1.35s 35 132 0
GPT-5.4 33.70s 0.95s 34 122 0

非ストリームの検証とは入力プロンプトが異なる(日本語の別質問を使用)ため、Input tokens数も異なります。

GPT-5.5の出力例:

Amazon Bedrock の主な特徴は以下の3つです。

  1. 複数の基盤モデルを利用可能
    AmazonやAnthropic、MetaなどのさまざまなAIモデルを選んで利用できます。

  2. サーバーレスで利用できる
    インフラ管理なしで、API経由で生成AIアプリケーションを構築できます。

  3. AWSサービスとの統合とセキュリティ
    IAMやVPC、CloudWatchなどAWSの機能と連携し、安全に運用できます。

TTFTはGPT-5.4が0.95s、GPT-5.5が1.35sでした。今回の検証では、総レイテンシが22〜34秒だった一方でTTFTは1秒前後となり、早い段階で最初のテキスト表示を開始できました。

Chat Completions API は GPT-5.5 / GPT-5.4 で非対応

GPT-5.5 / GPT-5.4ではChat Completions API(/v1/chat/completions)は対応していません。実際に呼び出すと400エラーが返されました。

# これは動作しない
response = client.chat.completions.create(
    model="openai.gpt-5.5",
    messages=[{"role": "user", "content": "Hello"}],
    max_tokens=256,
)
openai.BadRequestError: Error code: 400 - {
  "error": {
    "code": "validation_error",
    "message": "The model 'openai.gpt-5.5' does not support the '/v1/chat/completions' API",
    "param": null,
    "type": "invalid_request_error"
  }
}

GPT-5.4でも同様のエラーとなります。AWSブログの更新欄(2026年6月1日付)にも「Responses API only」と記載されており、本記事執筆時点ではこれらのモデルはResponses APIのみの対応です。

まとめ

日本国内向けのワークロードを運用するAWSアカウントでは、SCPによるリージョン制限で東京・大阪・バージニアのみ許可しオハイオは制限対象とするケースが多くあります。このような環境でもus-east-1対応によってBedrock上のOpenAIモデルを利用可能になりました。

https://classmethod.jp/news/240805-secure-account/

リージョン拡大に加え、6/1時点では未提供だったコンソール対応もリリースされています。

https://dev.classmethod.jp/articles/bedrock-mantle-console-gpt55/

Bedrock上のOpenAI環境の整備が進んでいるので、引き続き注目していきたいと思います。

参考リンク


国内企業 AI活用実態調査2026 配布中

クラスメソッドが独自に行なったAI診断調査をもとに、企業のAI活用の現在地を調査レポートとしてまとめました。企業規模別の活用度傾向に加え、規模を超えてAI活用を進める企業に共通する取り組みまで、自社の現在地を捉えるためのヒントにぜひ。

国内企業 AI活用実態調査2026

無料でダウンロードする

この記事をシェアする

AWSのお困り事はクラスメソッドへ

関連記事