
【アップデート】Claude Sonnet 5 が Google Cloud の Gemini Enterprise Agent Platform で利用可能になりました
はじめに
こんにちは。
クラウド事業本部コンサルティング部の渡邉です。
2026年6月30日、Anthropic は Claude Sonnet 4.6 の後継モデルとなる Claude Sonnet 5 を発表しました。
Google Cloud(Gemini Enterprise Agent Platform)でも同日 Claude Sonnet 5が利用可能になっています。
Claude API・Amazon Bedrock・Microsoft Foundry(Preview)など主要プラットフォームで同時に利用可能になっています。
Claude Sonnet 5 は「速度と知能の最適な組み合わせ」をコンセプトとした Sonnet クラスのモデルで、Opus 4.8 に近いパフォーマンスをより低価格で実現しているのが特徴です。推論・ツール利用・コーディングなどエージェント関連タスクで Sonnet 4.6 から大きく性能が向上しています。
本記事では、Gemini Enterprise Agent Platform(旧 Vertex AI)の Model Garden 上での Claude Sonnet 5 のスペック・料金・主なユースケースと、Google Cloud 上での実際の利用手順をご紹介します。
Gemini Enterprise Agent Platform での Claude Sonnet 5 について

Model Garden の Claude Sonnet 5 モデルカード
主なスペック
Model Garden の Claude Sonnet 5 モデルカードと、Anthropic 公式ドキュメントで確認できる基本スペックです。Sonnet 4.6 の値は Google Cloud のドキュメントに記載の値を参考に掲載しています。
| 項目 | Claude Sonnet 4.6 | Claude Sonnet 5 |
|---|---|---|
| Claude API モデル ID | claude-sonnet-4-6 |
claude-sonnet-5 |
| Google Cloud(Agent Platform)モデル ID | claude-sonnet-4-6 |
claude-sonnet-5 |
| Launch stage | GA | GA |
| リリース日 | 2026-02-17 | 2026-06-30 |
| 最大入力トークン | 1,000,000 | 1,000,000 |
| 最大出力トークン | 128,000 | 128,000(Batch API では output-300k-2026-03-24 ベータヘッダー指定で 300,000 まで対応) |
| 対応入力データ型 | Text, Code, Images, Documents | Text, Image, PDF |
| 適応的思考(Adaptive thinking) | 対応 | 対応(Claude API・Claude Code ではデフォルトで effort: high) |
| 拡張思考(手動指定) | 対応 | 非対応(budget_tokens 指定は 400 エラー) |
| 信頼できる知識のカットオフ | 2025年8月 | 2026年1月 |
Model Garden での機能サポート
Model Garden の Claude Sonnet 5 モデルカード「Feature Support」タブでは、以下の機能がハイライトされています。
| 機能 | 内容 |
|---|---|
| Memory tool(ベータ) | 会話をまたいで情報を保存・取得し、コンテキスト管理を強化 |
| 1M トークンコンテキストウィンドウ | 長文ドキュメント・長い会話を通じて一貫した理解を維持 |
| Enhanced tool orchestration | 複数ツールの並列実行と自動的なツールコール管理 |
| Prompt caching | プロンプトキャッシュによるコスト削減 |
| Batch prediction | バッチ処理によるコスト削減 |
| Count tokens | トークン数の事前カウント |
| Global endpoint | グローバルエンドポイントでの利用 |
Sonnet 4.6 からの主な変更点
| 変更点 | 内容 |
|---|---|
| 適応的思考がデフォルト有効 | thinking フィールドを指定しないリクエストも適応的思考付きで実行される。オフにするには thinking: {type: "disabled"} を指定 |
| 手動の拡張思考を削除 | thinking: {type: "enabled", budget_tokens: N} は 400 エラー。effort パラメータでの適応的思考を使用する |
| サンプリングパラメータ非対応 | temperature / top_p / top_k をデフォルト以外の値に設定すると 400 エラー |
| 新しいトークナイザー | 同じ入力テキストで Sonnet 4.6 より約30%多いトークン数になる(API仕様自体に変更はない) |
| サイバーセキュリティセーフガード | リアルタイムのサイバーセキュリティセーフガードを備えた初の Sonnet ティアモデル。該当するリクエストは stop_reason: "refusal" を含む HTTP 200 として拒否される |
主なスペック比較
Gemini Enterprise Agent Platform のモデルカード上で確認できる Sonnet 4.6 と Sonnet 5 のスペック比較です。
基本情報
API 呼び出し時に指定するモデル ID や、コンテキストウィンドウなどの基本スペックです。
| 項目 | Claude Sonnet 4.6 | Claude Sonnet 5 |
|---|---|---|
| モデルID | claude-sonnet-4-6 |
claude-sonnet-5 |
| Launch stage | GA | GA |
| リリース日 | 2026-02-17 | 2026-06-30 |
| 最大入力トークン | 1,000,000 | 1,000,000 |
| 最大出力トークン | 128,000 | 128,000 |
| 対応入力データ型 | Text, Code, Images, Documents | Text, Image, PDF |
| 出力 | Text | Text |
機能サポート
利用できる機能の一覧です。Sonnet 5 では Sonnet 4.6 と比べて Memory tool が新たに追加され、手動の Extended thinking は廃止されました。
| 機能 | Claude Sonnet 4.6 | Claude Sonnet 5 |
|---|---|---|
| Batch predictions | ○ | ○ |
| Prompt caching | ○ | ○ |
| Count tokens | ○ | ○ |
| Extended thinking(手動) | ○ | — |
| Memory tool | — | ○ |
| Computer use | ○ | ○ |
| Web search | ○ | ○ |
| Function calling | ○ | ○ |
Usage types
クォータの割り当て方式と、スループット確保オプションです。
| 種別 | Claude Sonnet 4.6 | Claude Sonnet 5 |
|---|---|---|
| クォータ方式 | Fixed quota | Shared Model Lineage Quota |
| Provisioned Throughput | ○ | ○ |
対応リージョン・クォータ
利用可能なリージョンです。
| リージョン | Claude Sonnet 4.6 | Claude Sonnet 5 |
|---|---|---|
| US Multi-region | ○ | ○ |
| Europe Multi-region | ○ | ○ |
| global endpoint | ○ | ○ |
| us-east5 | ○ | — |
| europe-west1 | ○ | — |
| asia-southeast1 | ○ | — |
料金
global リージョンと regional(リージョナル)リージョンでの料金です。導入価格は 2026年8月31日まで適用されます。
| 項目 | Launch pricing(〜2026/8/31) | Standard pricing |
|---|---|---|
| Input(1Mトークンあたり) | $2.00(global)/ $2.20(regional) | $3.00(global)/ $3.30(regional) |
| Output(1Mトークンあたり) | $10.00(global)/ $11.00(regional) | $15.00(global)/ $16.50(regional) |
| Cache 5m write | $2.50(global)/ $2.75(regional) | $3.75(global)/ $4.125(regional) |
| Cache 1h write | $4.00(global)/ $4.40(regional) | $6.00(global)/ $6.60(regional) |
| Cache hit | $0.20(global)/ $0.22(regional) | $0.30(global)/ $0.33(regional) |
| Batch Input | $1.00(global)/ $1.10(regional) | $1.50(global)/ $1.65(regional) |
| Batch Output | $5.00(global)/ $5.50(regional) | $7.50(global)/ $8.25(regional) |
Model Garden のモデルカードには以下の補足も記載されています。
- 1M トークンコンテキストに対する追加料金はなく、200K トークン以下と同一料金
- Sonnet 5 のクォータは Sonnet モデルファミリー全体で共有される(他の Sonnet モデルとクォータをシェアする)
主なユースケース
Model Garden のモデルカードに記載されている公式のユースケースは以下の 5 つです。
| ユースケース | 概要 |
|---|---|
| Agents(エージェント) | 本番のエージェントパイプラインでリードエージェント・サブエージェントの両方として動作可能。信頼性の高いツール利用と、大量のエージェントワークロードを運用できるコスト効率を両立 |
| Coding(コーディング) | 日々の開発作業に最適化。機能追加・リファクタリング・複雑なコードベースをまたいだデバッグを安定した品質でこなす |
| Enterprise workflows(エンタープライズワークフロー) | 本番品質のドキュメント・スプレッドシート・プレゼンテーション作成における修正の往復を削減。日常的なオフィス業務に強い、信頼できるモデルが必要なチームに最適 |
| Financial analysis(財務分析) | 汎用的な知能と高い分析・レポート作成力を両立し、精度と意思決定スピードが求められる高頻度の財務ワークフローに対応 |
| Computer use(コンピュータ操作) | 最も効率的な Computer use モデル。ブラウザ操作の自動化を、業務ツール全体に展開できるコストで実現 |
Google Cloud で Claude Sonnet 5 を使う理由
Google Cloud の Gemini Enterprise Agent Platform 上で Claude Sonnet 5 を利用することで、以下のGoogle Cloudのエンタープライズ機能をあわせて活用できます。
- データ主権・セキュリティ: VPC Service Controls、組織ポリシーによる通信制御、Model Armor によるプロンプトインジェクション・ツールポイズニング対策
- Provisioned Throughput: 固定コストで安定した処理能力を確保
- Prompt Caching: キャッシュ読み取りトークンのコスト削減(キャッシュヒット率に依存)
- Batch Predictions: バッチ処理によるコスト削減(標準料金より低価格)
- グローバルエンドポイント: 可用性向上のためのマルチリージョンルーティング
- Agent Runtime との統合: Memory Bank・Sessions による長期コンテキスト管理
実際に試してみる(Google Cloud Agent Platform 経由)
前提条件
- Google Cloud プロジェクトで Agent Platform API(
aiplatform.googleapis.com)が有効であること - Model Garden の Claude Sonnet 5 モデルカードでモデルを有効化済みであること
gcloud auth application-default loginでログイン済みであること
ステップ1: Model Garden でモデルを有効化する
API から呼び出す前に、Model Garden でモデルを有効化する必要があります。
Google Cloud コンソールから Agent Platform → モデル → Model Garden を開き、「パートナーのモデル」フィルターを選択します。Trending の先頭に Claude Sonnet 5 が表示されます。

Model GardenでClaude Sonnet 5を選択
Claude Sonnet 5 のカードをクリックするとモデル詳細ページが開きますので、「有効にする」ボタンをクリックして有効化を開始します。

モデルの有効化
有効化フォームが表示されます。会社情報・業種・Claude モデルの想定ユーザーなどを入力し、Anthropic の Acceptable Use Policy に抵触するユースケース(法務・医療・金融の消費者向けチャットボット等)の有無を確認して「次へ」をクリックします。

有効化フォーム
料金の概算が表示されます。
内容を確認し、利用規約・プロモーションクレジット条件に同意して「同意する」をクリックします。

利用規約に同意
「Claude Sonnet 5 を購入しました」ダイアログが表示されたら有効化完了です。
「Vertex AI で管理」ボタンからモデルの管理ページへ移動できます。

モデルの購入完了後画面
有効化後、Claude Sonnet 5が利用可能な状態になります。
ステップ2: curl でリクエストする
Agent Platform では、Claude API と異なり model をリクエストボディではなく URL に指定し、anthropic_version をボディ内で vertex-2023-10-16 に固定してリクエストします。
MODEL_ID=claude-sonnet-5
LOCATION=global
PROJECT_ID=YOUR_PROJECT_ID
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:streamRawPredict -d \
'{
"anthropic_version": "vertex-2023-10-16",
"messages": [{
"role": "user",
"content": "Hey Claude!"
}],
"max_tokens": 100
}'
リージョナルエンドポイント(us-east5 など)では https://${LOCATION}-aiplatform.googleapis.com のようにホスト名にロケーションを含めますが、global エンドポイントではホスト名は aiplatform.googleapis.com 固定で、ロケーションはパス側の locations/global のみで指定します。https://global-aiplatform.googleapis.com/... のように ${LOCATION}- をそのままホスト名に含めてしまうと、存在しないホスト名になり 404 Not Foundが返ります。
レスポンスが返ってきました。claude sonnet 5モデルを利用していることがわかります。
{
"model": "claude-sonnet-5",
"id": "msg_vrtx_013gf7XMD7TdL9J8nMU319fX",
"type": "message",
"role": "assistant",
"content": [
{
"type": "text",
"text": "Hey! What's on your mind today?"
}
],
"stop_reason": "end_turn",
"stop_sequence": null,
"stop_details": null,
"usage": {
"input_tokens": 13,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"cache_creation": {
"ephemeral_5m_input_tokens": 0,
"ephemeral_1h_input_tokens": 0
},
"output_tokens": 14,
"output_tokens_details": {
"thinking_tokens": 0
}
}
}
ステップ3: Python(Anthropic Vertex SDK)でリクエストする
Anthropic Vertex SDK を利用して、以下の Python コードを実行してみます。
まずは、必要なライブラリのインストールします。
pip install -U google-cloud-aiplatform "anthropic[vertex]"
from anthropic import AnthropicVertex
project_id = "YOUR_PROJECT_ID"
region = "global" # グローバルエンドポイント。データレジデンシー要件がある場合は "us" / "eu" やリージョン名を指定
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-5",
max_tokens=1024,
messages=[
{"role": "user", "content": "Hello, Claude Sonnet 5!"}
]
)
print(message.content[0].text)
レスポンスが返ってきました。こちらもclaude sonnet 5モデルを利用していることがわかります。
Message(id='msg_vrtx_01G7o2bVNFoUhZuvDzQmFJYs', container=None, content=[TextBlock(citations=None, text='Hello! I\'m Claude, though I should clarify - I don\'t have access to information confirming a specific version number like "Sonnet 5," so I can\'t verify that detail about myself. I\'m happy to just chat as Claude, though!\n\nWhat can I help you with today?', type='text')], model='claude-sonnet-5', role='assistant', stop_details=None, stop_reason='end_turn', stop_sequence=None, type='message', usage=Usage(cache_creation=CacheCreation(ephemeral_1h_input_tokens=0, ephemeral_5m_input_tokens=0), cache_creation_input_tokens=0, cache_read_input_tokens=0, inference_geo=None, input_tokens=21, output_tokens=83, output_tokens_details=OutputTokensDetails(thinking_tokens=0), server_tool_use=None, service_tier=None)
Agent Platform はグローバルエンドポイント(global)・マルチリージョンエンドポイント(us / eu)・リージョナルエンドポイント(us-east1 など)の3種類を提供しています。マルチリージョン・リージョナルエンドポイントはグローバルエンドポイントに対して10%の料金プレミアムが課されます(Sonnet 4.5以降のモデルに適用)。データレジデンシー要件がない場合はグローバルエンドポイントの利用が推奨されています。
まとめ
今回は Gemini Enterprise Agent Platform(旧 Vertex AI)の Model Garden 上での Claude Sonnet 5 のスペック・料金・主なユースケースと、Google Cloud 上での実際の利用手順をご紹介しました。
Claude Sonnet 5 は、Sonnet 4.6 から API 互換のままアップグレードできるモデルとして 2026年6月30日にリリースされました。価格は1Mトークンあたり入力$3・出力$15(2026年8月31日までは導入価格として入力$2・出力$10)と Sonnet 4.6 から変わらない一方、推論・ツール利用・コーディングなどエージェント関連タスクの性能が向上しており、Opus クラスに近い性能をより低コストで利用できる選択肢になっています。
Google Cloud の Gemini Enterprise Agent Platform でもモデル ID claude-sonnet-5 として同日に利用可能になっており、既存の Claude on Vertex AI 連携をそのままモデル ID の差し替えだけで移行できます。ただし新しいトークナイザーにより同じテキストでもトークン消費量が増える点や、手動の拡張思考・カスタムサンプリングパラメータが使えなくなる点には注意が必要です。既に Sonnet 4.6 で安定稼働しているエージェント・コーディング用途のワークロードがあれば、まずはステージング環境でモデル ID を切り替えて挙動を確認してみることをおすすめします。
この記事が誰かの助けになれば幸いです。
以上、クラウド事業本部コンサルティング部の渡邉でした!







