【アップデート】Claude Sonnet 5 が Google Cloud の Gemini Enterprise Agent Platform で利用可能になりました

2026.07.01

 はじめにこんにちは。

クラウド事業本部コンサルティング部の渡邉です。
2026年6月30日、Anthropic は Claude Sonnet 4.6 の後継モデルとなる Claude Sonnet 5 を発表しました。
https://www.anthropic.com/news/claude-sonnet-5
Google Cloud（Gemini Enterprise Agent Platform）でも同日 Claude Sonnet 5が利用可能になっています。
https://docs.cloud.google.com/gemini-enterprise-agent-platform/models/partner-models/claude/sonnet-5
Claude API・Amazon Bedrock・Microsoft Foundry（Preview）など主要プラットフォームで同時に利用可能になっています。
Claude Sonnet 5 は「速度と知能の最適な組み合わせ」をコンセプトとした Sonnet クラスのモデルで、Opus 4.8 に近いパフォーマンスをより低価格で実現しているのが特徴です。推論・ツール利用・コーディングなどエージェント関連タスクで Sonnet 4.6 から大きく性能が向上しています。
本記事では、Gemini Enterprise Agent Platform（旧 Vertex AI）の Model Garden 上での Claude Sonnet 5 のスペック・料金・主なユースケースと、Google Cloud 上での実際の利用手順をご紹介します。
 Gemini Enterprise Agent Platform での Claude Sonnet 5 について

Model Garden の Claude Sonnet 5 モデルカード
 主なスペックModel Garden の Claude Sonnet 5 モデルカードと、Anthropic 公式ドキュメントで確認できる基本スペックです。Sonnet 4.6 の値は Google Cloud のドキュメントに記載の値を参考に掲載しています。


項目
Claude Sonnet 4.6
Claude Sonnet 5


Claude API モデル ID
claude-sonnet-4-6
claude-sonnet-5

Google Cloud（Agent Platform）モデル ID
claude-sonnet-4-6
claude-sonnet-5

Launch stage
GA
GA

リリース日
2026-02-17
2026-06-30

最大入力トークン
1,000,000
1,000,000

最大出力トークン
128,000
128,000（Batch API では output-300k-2026-03-24 ベータヘッダー指定で 300,000 まで対応）

対応入力データ型
Text, Code, Images, Documents
Text, Image, PDF

適応的思考（Adaptive thinking）
対応
対応（Claude API・Claude Code ではデフォルトで effort: high）

拡張思考（手動指定）
対応
非対応（budget_tokens 指定は 400 エラー）

信頼できる知識のカットオフ
2025年8月
2026年1月

 Model Garden での機能サポートModel Garden の Claude Sonnet 5 モデルカード「Feature Support」タブでは、以下の機能がハイライトされています。


機能
内容


Memory tool（ベータ）
会話をまたいで情報を保存・取得し、コンテキスト管理を強化

1M トークンコンテキストウィンドウ
長文ドキュメント・長い会話を通じて一貫した理解を維持

Enhanced tool orchestration
複数ツールの並列実行と自動的なツールコール管理

Prompt caching
プロンプトキャッシュによるコスト削減

Batch prediction
バッチ処理によるコスト削減

Count tokens
トークン数の事前カウント

Global endpoint
グローバルエンドポイントでの利用

 Sonnet 4.6 からの主な変更点

変更点
内容


適応的思考がデフォルト有効
thinking フィールドを指定しないリクエストも適応的思考付きで実行される。オフにするには thinking: {type: "disabled"} を指定

手動の拡張思考を削除
thinking: {type: "enabled", budget_tokens: N} は 400 エラー。effort パラメータでの適応的思考を使用する

サンプリングパラメータ非対応
temperature / top_p / top_k をデフォルト以外の値に設定すると 400 エラー

新しいトークナイザー
同じ入力テキストで Sonnet 4.6 より約30%多いトークン数になる（API仕様自体に変更はない）

サイバーセキュリティセーフガード
リアルタイムのサイバーセキュリティセーフガードを備えた初の Sonnet ティアモデル。該当するリクエストは stop_reason: "refusal" を含む HTTP 200 として拒否される

!新しいトークナイザーにより、同じテキストでも usage のトークン数・max_tokens の消費量が Sonnet 4.6 時代より増加します。トークン数で予算管理している場合は、移行前に トークンカウント で再計測することをおすすめします。
 主なスペック比較Gemini Enterprise Agent Platform のモデルカード上で確認できる Sonnet 4.6 と Sonnet 5 のスペック比較です。
基本情報
API 呼び出し時に指定するモデル ID や、コンテキストウィンドウなどの基本スペックです。


項目
Claude Sonnet 4.6
Claude Sonnet 5


モデルID
claude-sonnet-4-6
claude-sonnet-5

Launch stage
GA
GA

リリース日
2026-02-17
2026-06-30

最大入力トークン
1,000,000
1,000,000

最大出力トークン
128,000
128,000

対応入力データ型
Text, Code, Images, Documents
Text, Image, PDF

出力
Text
Text

機能サポート
利用できる機能の一覧です。Sonnet 5 では Sonnet 4.6 と比べて Memory tool が新たに追加され、手動の Extended thinking は廃止されました。


機能
Claude Sonnet 4.6
Claude Sonnet 5


Batch predictions
○
○

Prompt caching
○
○

Count tokens
○
○

Extended thinking（手動）
○
—

Memory tool
—
○

Computer use
○
○

Web search
○
○

Function calling
○
○

Usage types
クォータの割り当て方式と、スループット確保オプションです。


種別
Claude Sonnet 4.6
Claude Sonnet 5


クォータ方式
Fixed quota
Shared Model Lineage Quota

Provisioned Throughput
○
○

対応リージョン・クォータ
利用可能なリージョンです。


リージョン
Claude Sonnet 4.6
Claude Sonnet 5


US Multi-region
○
○

Europe Multi-region
○
○

global endpoint
○
○

us-east5
○
—

europe-west1
○
—

asia-southeast1
○
—

 料金global リージョンと regional（リージョナル）リージョンでの料金です。導入価格は 2026年8月31日まで適用されます。


項目
Launch pricing（〜2026/8/31）
Standard pricing


Input（1Mトークンあたり）
$2.00（global）/ $2.20（regional）
$3.00（global）/ $3.30（regional）

Output（1Mトークンあたり）
$10.00（global）/ $11.00（regional）
$15.00（global）/ $16.50（regional）

Cache 5m write
$2.50（global）/ $2.75（regional）
$3.75（global）/ $4.125（regional）

Cache 1h write
$4.00（global）/ $4.40（regional）
$6.00（global）/ $6.60（regional）

Cache hit
$0.20（global）/ $0.22（regional）
$0.30（global）/ $0.33（regional）

Batch Input
$1.00（global）/ $1.10（regional）
$1.50（global）/ $1.65（regional）

Batch Output
$5.00（global）/ $5.50（regional）
$7.50（global）/ $8.25（regional）

Model Garden のモデルカードには以下の補足も記載されています。
1M トークンコンテキストに対する追加料金はなく、200K トークン以下と同一料金
Sonnet 5 のクォータは Sonnet モデルファミリー全体で共有される（他の Sonnet モデルとクォータをシェアする）
 主なユースケースModel Garden のモデルカードに記載されている公式のユースケースは以下の 5 つです。


ユースケース
概要


Agents（エージェント）
本番のエージェントパイプラインでリードエージェント・サブエージェントの両方として動作可能。信頼性の高いツール利用と、大量のエージェントワークロードを運用できるコスト効率を両立

Coding（コーディング）
日々の開発作業に最適化。機能追加・リファクタリング・複雑なコードベースをまたいだデバッグを安定した品質でこなす

Enterprise workflows（エンタープライズワークフロー）
本番品質のドキュメント・スプレッドシート・プレゼンテーション作成における修正の往復を削減。日常的なオフィス業務に強い、信頼できるモデルが必要なチームに最適

Financial analysis（財務分析）
汎用的な知能と高い分析・レポート作成力を両立し、精度と意思決定スピードが求められる高頻度の財務ワークフローに対応

Computer use（コンピュータ操作）
最も効率的な Computer use モデル。ブラウザ操作の自動化を、業務ツール全体に展開できるコストで実現

 Google Cloud で Claude Sonnet 5 を使う理由Google Cloud の Gemini Enterprise Agent Platform 上で Claude Sonnet 5 を利用することで、以下のGoogle Cloudのエンタープライズ機能をあわせて活用できます。
データ主権・セキュリティ: VPC Service Controls、組織ポリシーによる通信制御、Model Armor によるプロンプトインジェクション・ツールポイズニング対策
Provisioned Throughput: 固定コストで安定した処理能力を確保
Prompt Caching: キャッシュ読み取りトークンのコスト削減（キャッシュヒット率に依存）
Batch Predictions: バッチ処理によるコスト削減（標準料金より低価格）
グローバルエンドポイント: 可用性向上のためのマルチリージョンルーティング
Agent Runtime との統合: Memory Bank・Sessions による長期コンテキスト管理
 実際に試してみる（Google Cloud Agent Platform 経由） 前提条件Google Cloud プロジェクトで Agent Platform API（aiplatform.googleapis.com）が有効であること
Model Garden の Claude Sonnet 5 モデルカードでモデルを有効化済みであること
gcloud auth application-default login でログイン済みであること
 ステップ1: Model Garden でモデルを有効化するAPI から呼び出す前に、Model Garden でモデルを有効化する必要があります。
Google Cloud コンソールから Agent Platform → モデル → Model Garden を開き、「パートナーのモデル」フィルターを選択します。Trending の先頭に Claude Sonnet 5 が表示されます。


Model GardenでClaude Sonnet 5を選択
Claude Sonnet 5 のカードをクリックするとモデル詳細ページが開きますので、「有効にする」ボタンをクリックして有効化を開始します。


モデルの有効化
有効化フォームが表示されます。会社情報・業種・Claude モデルの想定ユーザーなどを入力し、Anthropic の Acceptable Use Policy に抵触するユースケース（法務・医療・金融の消費者向けチャットボット等）の有無を確認して「次へ」をクリックします。


有効化フォーム
料金の概算が表示されます。

内容を確認し、利用規約・プロモーションクレジット条件に同意して「同意する」をクリックします。


利用規約に同意
「Claude Sonnet 5 を購入しました」ダイアログが表示されたら有効化完了です。

「Vertex AI で管理」ボタンからモデルの管理ページへ移動できます。


モデルの購入完了後画面
有効化後、Claude Sonnet 5が利用可能な状態になります。
 ステップ2: curl でリクエストするAgent Platform では、Claude API と異なり model をリクエストボディではなく URL に指定し、anthropic_version をボディ内で vertex-2023-10-16 に固定してリクエストします。
MODEL_ID=claude-sonnet-5
LOCATION=global
PROJECT_ID=YOUR_PROJECT_ID

curl \
  -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:streamRawPredict -d \
  '{
    "anthropic_version": "vertex-2023-10-16",
    "messages": [{
      "role": "user",
      "content": "Hey Claude!"
    }],
    "max_tokens": 100
  }'
リージョナルエンドポイント（us-east5 など）では https://${LOCATION}-aiplatform.googleapis.com のようにホスト名にロケーションを含めますが、global エンドポイントではホスト名は aiplatform.googleapis.com 固定で、ロケーションはパス側の locations/global のみで指定します。https://global-aiplatform.googleapis.com/... のように ${LOCATION}- をそのままホスト名に含めてしまうと、存在しないホスト名になり 404 Not Foundが返ります。
レスポンスが返ってきました。claude sonnet 5モデルを利用していることがわかります。
{
	"model": "claude-sonnet-5",
	"id": "msg_vrtx_013gf7XMD7TdL9J8nMU319fX",
	"type": "message",
	"role": "assistant",
	"content": [
		{
			"type": "text",
			"text": "Hey! What's on your mind today?"
		}
	],
	"stop_reason": "end_turn",
	"stop_sequence": null,
	"stop_details": null,
	"usage": {
		"input_tokens": 13,
		"cache_creation_input_tokens": 0,
		"cache_read_input_tokens": 0,
		"cache_creation": {
			"ephemeral_5m_input_tokens": 0,
			"ephemeral_1h_input_tokens": 0
		},
		"output_tokens": 14,
		"output_tokens_details": {
			"thinking_tokens": 0
		}
	}
}
 ステップ3: Python（Anthropic Vertex SDK）でリクエストするAnthropic Vertex SDK を利用して、以下の Python コードを実行してみます。

まずは、必要なライブラリのインストールします。
pip install -U google-cloud-aiplatform "anthropic[vertex]"
from anthropic import AnthropicVertex

project_id = "YOUR_PROJECT_ID"
region = "global"  # グローバルエンドポイント。データレジデンシー要件がある場合は "us" / "eu" やリージョン名を指定

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-5",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Hello, Claude Sonnet 5!"}
    ]
)
print(message.content[0].text)
レスポンスが返ってきました。こちらもclaude sonnet 5モデルを利用していることがわかります。
Message(id='msg_vrtx_01G7o2bVNFoUhZuvDzQmFJYs', container=None, content=[TextBlock(citations=None, text='Hello! I\'m Claude, though I should clarify - I don\'t have access to information confirming a specific version number like "Sonnet 5," so I can\'t verify that detail about myself. I\'m happy to just chat as Claude, though!\n\nWhat can I help you with today?', type='text')], model='claude-sonnet-5', role='assistant', stop_details=None, stop_reason='end_turn', stop_sequence=None, type='message', usage=Usage(cache_creation=CacheCreation(ephemeral_1h_input_tokens=0, ephemeral_5m_input_tokens=0), cache_creation_input_tokens=0, cache_read_input_tokens=0, inference_geo=None, input_tokens=21, output_tokens=83, output_tokens_details=OutputTokensDetails(thinking_tokens=0), server_tool_use=None, service_tier=None)
Agent Platform はグローバルエンドポイント（global）・マルチリージョンエンドポイント（us / eu）・リージョナルエンドポイント（us-east1 など）の3種類を提供しています。マルチリージョン・リージョナルエンドポイントはグローバルエンドポイントに対して10%の料金プレミアムが課されます（Sonnet 4.5以降のモデルに適用）。データレジデンシー要件がない場合はグローバルエンドポイントの利用が推奨されています。
 まとめ今回は Gemini Enterprise Agent Platform（旧 Vertex AI）の Model Garden 上での Claude Sonnet 5 のスペック・料金・主なユースケースと、Google Cloud 上での実際の利用手順をご紹介しました。
Claude Sonnet 5 は、Sonnet 4.6 から API 互換のままアップグレードできるモデルとして 2026年6月30日にリリースされました。価格は1Mトークンあたり入力$3・出力$15（2026年8月31日までは導入価格として入力$2・出力$10）と Sonnet 4.6 から変わらない一方、推論・ツール利用・コーディングなどエージェント関連タスクの性能が向上しており、Opus クラスに近い性能をより低コストで利用できる選択肢になっています。
Google Cloud の Gemini Enterprise Agent Platform でもモデル ID claude-sonnet-5 として同日に利用可能になっており、既存の Claude on Vertex AI 連携をそのままモデル ID の差し替えだけで移行できます。ただし新しいトークナイザーにより同じテキストでもトークン消費量が増える点や、手動の拡張思考・カスタムサンプリングパラメータが使えなくなる点には注意が必要です。既に Sonnet 4.6 で安定稼働しているエージェント・コーディング用途のワークロードがあれば、まずはステージング環境でモデル ID を切り替えて挙動を確認してみることをおすすめします。
この記事が誰かの助けになれば幸いです。
以上、クラウド事業本部コンサルティング部の渡邉でした!

【アップデート】Claude Sonnet 5 が Google Cloud の Gemini Enterprise Agent Platform で利用可能になりました

はじめに

Gemini Enterprise Agent Platform での Claude Sonnet 5 について

主なスペック

Model Garden での機能サポート

Sonnet 4.6 からの主な変更点

主なスペック比較

料金

主なユースケース

Google Cloud で Claude Sonnet 5 を使う理由

実際に試してみる（Google Cloud Agent Platform 経由）

前提条件

ステップ1: Model Garden でモデルを有効化する

ステップ2: curl でリクエストする

ステップ3: Python（Anthropic Vertex SDK）でリクエストする

まとめ

Claudeならクラスメソッドにお任せください

関連記事

AWSで探す

注目のテーマ

プロダクトやサービスで探す

特集やシリーズから探す

EVENTS

項目	Claude Sonnet 4.6	Claude Sonnet 5
Claude API モデル ID	`claude-sonnet-4-6`	`claude-sonnet-5`
Google Cloud（Agent Platform）モデル ID	`claude-sonnet-4-6`	`claude-sonnet-5`
Launch stage	GA	GA
リリース日	2026-02-17	2026-06-30
最大入力トークン	1,000,000	1,000,000
最大出力トークン	128,000	128,000（Batch API では `output-300k-2026-03-24` ベータヘッダー指定で 300,000 まで対応）
対応入力データ型	Text, Code, Images, Documents	Text, Image, PDF
適応的思考（Adaptive thinking）	対応	対応（Claude API・Claude Code ではデフォルトで `effort: high`）
拡張思考（手動指定）	対応	非対応（`budget_tokens` 指定は 400 エラー）
信頼できる知識のカットオフ	2025年8月	2026年1月

機能	内容
Memory tool（ベータ）	会話をまたいで情報を保存・取得し、コンテキスト管理を強化
1M トークンコンテキストウィンドウ	長文ドキュメント・長い会話を通じて一貫した理解を維持
Enhanced tool orchestration	複数ツールの並列実行と自動的なツールコール管理
Prompt caching	プロンプトキャッシュによるコスト削減
Batch prediction	バッチ処理によるコスト削減
Count tokens	トークン数の事前カウント
Global endpoint	グローバルエンドポイントでの利用

変更点	内容
適応的思考がデフォルト有効	`thinking` フィールドを指定しないリクエストも適応的思考付きで実行される。オフにするには `thinking: {type: "disabled"}` を指定
手動の拡張思考を削除	`thinking: {type: "enabled", budget_tokens: N}` は 400 エラー。`effort` パラメータでの適応的思考を使用する
サンプリングパラメータ非対応	`temperature` / `top_p` / `top_k` をデフォルト以外の値に設定すると 400 エラー
新しいトークナイザー	同じ入力テキストで Sonnet 4.6 より約30%多いトークン数になる（API仕様自体に変更はない）
サイバーセキュリティセーフガード	リアルタイムのサイバーセキュリティセーフガードを備えた初の Sonnet ティアモデル。該当するリクエストは `stop_reason: "refusal"` を含む HTTP 200 として拒否される

項目	Claude Sonnet 4.6	Claude Sonnet 5
モデルID	`claude-sonnet-4-6`	`claude-sonnet-5`
Launch stage	GA	GA
リリース日	2026-02-17	2026-06-30
最大入力トークン	1,000,000	1,000,000
最大出力トークン	128,000	128,000
対応入力データ型	Text, Code, Images, Documents	Text, Image, PDF
出力	Text	Text

機能	Claude Sonnet 4.6	Claude Sonnet 5
Batch predictions	○	○
Prompt caching	○	○
Count tokens	○	○
Extended thinking（手動）	○	—
Memory tool	—	○
Computer use	○	○
Web search	○	○
Function calling	○	○

種別	Claude Sonnet 4.6	Claude Sonnet 5
クォータ方式	Fixed quota	Shared Model Lineage Quota
Provisioned Throughput	○	○

リージョン	Claude Sonnet 4.6	Claude Sonnet 5
US Multi-region	○	○
Europe Multi-region	○	○
global endpoint	○	○
us-east5	○	—
europe-west1	○	—
asia-southeast1	○	—

項目	Launch pricing（〜2026/8/31）	Standard pricing
Input（1Mトークンあたり）	$2.00（global）/ $2.20（regional）	$3.00（global）/ $3.30（regional）
Output（1Mトークンあたり）	$10.00（global）/ $11.00（regional）	$15.00（global）/ $16.50（regional）
Cache 5m write	$2.50（global）/ $2.75（regional）	$3.75（global）/ $4.125（regional）
Cache 1h write	$4.00（global）/ $4.40（regional）	$6.00（global）/ $6.60（regional）
Cache hit	$0.20（global）/ $0.22（regional）	$0.30（global）/ $0.33（regional）
Batch Input	$1.00（global）/ $1.10（regional）	$1.50（global）/ $1.65（regional）
Batch Output	$5.00（global）/ $5.50（regional）	$7.50（global）/ $8.25（regional）

ユースケース	概要
Agents（エージェント）	本番のエージェントパイプラインでリードエージェント・サブエージェントの両方として動作可能。信頼性の高いツール利用と、大量のエージェントワークロードを運用できるコスト効率を両立
Coding（コーディング）	日々の開発作業に最適化。機能追加・リファクタリング・複雑なコードベースをまたいだデバッグを安定した品質でこなす
Enterprise workflows（エンタープライズワークフロー）	本番品質のドキュメント・スプレッドシート・プレゼンテーション作成における修正の往復を削減。日常的なオフィス業務に強い、信頼できるモデルが必要なチームに最適
Financial analysis（財務分析）	汎用的な知能と高い分析・レポート作成力を両立し、精度と意思決定スピードが求められる高頻度の財務ワークフローに対応
Computer use（コンピュータ操作）	最も効率的な Computer use モデル。ブラウザ操作の自動化を、業務ツール全体に展開できるコストで実現