
【アップデート】Gemini Enterprise Agent Platform で Claude Opus 4.8 が利用可能になりました
はじめに
こんにちは。
クラウド事業本部コンサルティング部の渡邉です。
2026年5月28日、Anthropic の最新モデル Claude Opus 4.8 が Google Cloud の Gemini Enterprise Agent Platform(旧 Vertex AI)の Model Garden で利用可能になりました。
Claude Opus 4.8 は、前世代の Opus 4.7 から大幅に改善されたモデルです。コーディング・法務・長期エージェントタスクで顕著な性能向上を達成しており、claude.aiとCoworkでは、応答の品質と速度のトレードオフをユーザーが選択できるEffort Level Controlが新たに追加されました。また正直性・アラインメント評価でも新水準に到達しています。
Google Cloud の Gemini Enterprise Agent Platform 上で利用することで、エンタープライズレベルのセキュリティ・データ主権・スケーラビリティと組み合わせて活用できます。
本記事では、Gemini Enterprise Agent Platform(旧 Vertex AI)での Claude Opus 4.8 の機能紹介と、Google Cloud 上での実際の利用手順をご紹介します。
Gemini Enterprise Agent Platform(旧 Vertex AI)での Claude Opus 4.8について
主なスペック比較
Gemini Enterprise Agent Platformのモデルカード上で確認できるOpus 4.7とOpus 4.8のスペック比較です。
基本情報
API 呼び出し時に指定するモデル ID や、コンテキストウィンドウなどの基本スペックです。
| 項目 | Claude Opus 4.7 | Claude Opus 4.8 |
|---|---|---|
| モデルID | claude-opus-4-7 |
claude-opus-4-8 |
| Launch stage | GA | GA |
| リリース日 | 2026-04-15 | 2026-05-28 |
| サポート終了予定 | 2027-04-16 以降 | 2027-05-28 以降 |
| 最大入力トークン | 1,000,000 | 1,000,000 |
| 最大出力トークン | 128,000 | 128,000 |
| 対応入力データ型 | Text, Code, Images, Documents | Text, Image, PDF |
| 出力 | Text | Text |
機能サポート
利用できる機能の一覧です。Opus 4.8 では Opus 4.7 と比べて Memory tool が新たに追加されています。
| 機能 | Claude Opus 4.7 | Claude Opus 4.8 |
|---|---|---|
| Computer use | ○ | ○ |
| Web search | ○ | ○ |
| Batch predictions | ○ | ○ |
| Prompt caching | ○ | ○ |
| Function calling | ○ | ○ |
| Extended thinking | ○ | ○ |
| Count tokens | ○ | ○ |
| Memory tool | — | ○ |
Usage types
クォータの割り当て方式と、スループット確保オプションです。
| 種別 | Claude Opus 4.7 | Claude Opus 4.8 |
|---|---|---|
| Fixed quota / Shared Model Lineage Quota | Fixed quota | Shared Model Lineage Quota |
| Provisioned Throughput | ○ | ○ |
対応リージョン・クォータ
利用可能なリージョンとデフォルトのクォータ上限です。Opus 4.8 は Opus 4.7 と比べて QPM・TPM ともに 2.5倍に引き上げられています。
| リージョン | Claude Opus 4.7 | Claude Opus 4.8 |
|---|---|---|
| 対応リージョン | US Multi-region, Europe Multi-region, global endpoint | US Multi-region, Europe Multi-region, global endpoint |
| Multi-region QPM | 400 | 1,000 |
| Multi-region Input TPM | 4,000,000 | 10,000,000 |
| Multi-region Output TPM | 400,000 | 1,000,000 |
| global endpoint QPM | 800 | 2,000 |
| global endpoint Input TPM | 8,000,000 | 20,000,000 |
| global endpoint Output TPM | 800,000 | 2,000,000 |
| Context length | 1,000,000 | 1,000,000 |
料金
global リージョンでの利用ですが、Opus 4.8 の料金体系は Opus 4.7 と同額でした。
| 項目 | Claude Opus 4.8 | Claude Opus 4.7 |
|---|---|---|
| Input | $5.00 | $5.00 |
| Output | $25.00 | $25.00 |
| Batch Input | $2.50 | $2.50 |
| Batch Output | $12.50 | $12.50 |
| 5m Cache Write | $6.25 | $6.25 |
| 1h Cache Write | $10.00 | $10.00 |
| Cache Hit | $0.50 | $0.50 |
| 5m Batch Cache Write | $3.125 | $3.125 |
| 1h Batch Cache Write | $5.00 | $5.00 |
| Batch Cache Hit | $0.25 | $0.25 |
最新料金は Agent Platform 料金ページ でご確認ください。
注目の新機能
Opus 4.8 では複数の新機能が追加されています。
Dynamic workflows(並列サブエージェント実行)
Claude Code では数百の並列サブエージェントを実行できるDynamic workflowsが追加されました。大規模コードベースの移行や分析といった、複数エージェントの協調が必要なタスクに対応できます。
Messages API 拡張
Messages API がメッセージ配列内のシステムエントリを受け入れられるようになりました。プロンプトキャッシュを保持したまま、システムプロンプトを更新できます。
Memory tool(ベータ)(Google Cloud 提供機能)
会話をまたいで情報を保存・取得できるメモリ機能です。エージェントが複数のセッションにわたって文脈を保持できるため、長期プロジェクトの継続的な支援が可能になります。
Enhanced tool orchestration(Google Cloud 提供機能)
複数ツールの並列実行と、ツールコールの自動管理が可能になりました。エージェントが依存関係を把握しながらツールを効率的にオーケストレーションできます。
Fast mode(研究プレビュー)
Claude API で speed: "fast" を指定することで、最大 2.5倍の出力トークン/秒を得られます。プレミアム料金が適用されますが、応答速度が重要なユースケースに有効です(現在 Claude API での研究プレビュー)。
主なユースケース
モデルカードに記載されている公式のユースケースは以下の 6 つです。
| ユースケース | 概要 |
|---|---|
| コーディング | コードベースを専門家のように読み解き、編集前に計画を立てる。依存関係を追跡しながら数時間にわたる複数ステージのタスクを自律実行できる |
| エンタープライズワークフロー | 長文書の横断的な推論、マルチステージプロジェクトのエンドツーエンド管理、スプレッドシート・スライド・ドキュメントのプロ品質出力 |
| 長期エージェント | 改善されたツール利用と創造的問題解決を組み合わせ、複雑な依存連鎖を最小限の監視でこなす |
| 財務分析 | 投資リサーチや決算分析で、高密度なファイリングやチャートを高精度に読み取り、決算サイクル全体でコンテキストを維持 |
| サイバーセキュリティ | 脅威インテリジェンス、脆弱性検出、アラートトリアージ、インシデント対応。長いトレースと大規模コードベースを保持して微妙なパターンを検出 |
| Computer use | 改善されたビジョンと深い推論を組み合わせ、複数アプリケーションをまたぐマルチステップタスクを計画・実行できる GA 最高性能モデル |
Google Cloud で Claude Opus 4.8 を使う理由
Google Cloud の Gemini Enterprise Agent Platform 上で Claude Opus 4.8 を利用することで、以下のエンタープライズ機能をあわせて活用できます。
- データ主権・セキュリティ: VPC Service Controls、組織ポリシーによる通信制御
- Provisioned Throughput: 固定コストで安定した処理能力を確保
- Prompt Caching: キャッシュ読み取りトークンが最大 90% オフ(全体コスト削減幅はキャッシュヒット率に依存。キャッシュ書き込みには追加コストあり)
- Batch Predictions: バッチ処理で 50% のコスト削減(入力 $2.50、出力 $12.50 と標準料金の半額)
- グローバルエンドポイント: 可用性向上のためのマルチリージョンルーティング
- Agent Runtime との統合: Memory Bank・Sessions による長期コンテキスト管理
実際に試してみる
前提条件
- Google Cloud プロジェクト(請求先アカウント設定済み)
- Gemini Enterprise Agent Platform の有効化
- 以下のロールが付与されたサービスアカウントまたはユーザー:
roles/aiplatform.userroles/consumerprocurement.entitlementManager(Model Garden でのモデル有効化に必要)
- Python 3.8 以上
- Anthropic Vertex SDK:
pip install 'anthropic[vertex]'
ステップ 1: Opus 4.8 の有効化
API から呼び出す前に、Model Garden でモデルを有効化する必要があります。
Google Cloud コンソールから Agent Platform → モデル → Model Garden を開き、「パートナーのモデル」フィルターを選択します。Trending の先頭に Claude Opus 4.8 が表示されます。

Model Garden のパートナーモデル一覧。Claude Opus 4.8 が最上位に表示されている
Claude Opus 4.8 のカードをクリックするとモデル詳細ページが開きますので、「有効にする」ボタンをクリックして有効化を開始します。

Claude Opus 4.8 のモデルカード
有効化フォームが表示されます。会社情報・業種・Claude モデルの想定ユーザーなどを入力し、Anthropic の Acceptable Use Policy に抵触するユースケース(法務・医療・金融の消費者向けチャットボット等)の有無を確認して「次へ」をクリックします。

有効化フォーム
料金の概算が表示されます。
たとえば global リージョンの Batch Cache Read トークン(コンテキストウィンドウ 0〜200,000 トークン)は JPY 39.89 / 1M tokens 程度です。
内容を確認し、利用規約・プロモーションクレジット条件に同意して「同意する」をクリックします。

Agreements 画面
「Claude Opus 4.8 を購入しました」ダイアログが表示されたら有効化完了です。
「Vertex AI で管理」ボタンからモデルの管理ページへ移動できます。

購入ダイアログ
有効化後はモデルカードのボタンが「Agent Studio で聞く」に変わり、コンソール上からそのまま対話できる状態になります。

有効化後のモデルカード
これで Opus 4.8 の有効化作業は完了です。
ステップ 2: 認証の設定
# アプリケーションデフォルト認証を設定
gcloud auth application-default login
# プロジェクトを設定
gcloud config set project YOUR_PROJECT_ID
認証が完了すると ~/.config/gcloud/application_default_credentials.json が生成され、SDK が自動的に読み込みます。
ステップ 3: Anthropic Vertex SDK でメッセージを送信
Anthropic Vertex SDK を利用して、以下の Python コードを実行してみます。
from anthropic import AnthropicVertex
# TODO: YOUR_PROJECT_ID をご自身のプロジェクト ID に変更してください
PROJECT_ID = "YOUR_PROJECT_ID"
client = AnthropicVertex(project_id=PROJECT_ID, region="global")
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Google CloudでClaudeモデルを利用するメリットを教えてください。"
}
]
)
print(message.content[0].text)
以下の回答が得られました。
# Google Cloud(Vertex AI)でClaudeを利用するメリット
Google CloudのVertex AI上でAnthropic社のClaudeモデルを利用する主なメリットをご紹介します。
## 1. 既存のGoogle Cloud環境との統合
- **認証・権限管理の一元化**:IAM(Identity and Access Management)でアクセス制御を統一できる
- **既存プロジェクトへの組み込みが容易**:すでにGCPを使っている場合、新規契約や別ベンダー管理が不要
- **VPC内での通信**:プライベートネットワーク経由でのアクセスが可能
## 2. セキュリティ・コンプライアンス
- **データガバナンス**:Google Cloudのセキュリティ基準・各種認証(ISO、SOC等)に準拠
- **データの取り扱い**:入力データがモデルの学習に使用されない
- **リージョン選択**:データ所在地の要件に対応しやすい
## 3. 運用・管理面
- **請求の一元化**:Google Cloudの請求にまとめられる
- **モニタリング**:Cloud LoggingやCloud Monitoringと連携した監視
- **クォータ管理**:利用量の管理がしやすい
## 4. 開発の柔軟性
- **マルチモデル戦略**:GeminiなどGoogleのモデルとClaudeを同一基盤で比較・併用できる
- **BigQueryなどとの連携**:Google Cloudのデータ分析サービスとの組み合わせ
まとめ
今回は Gemini Enterprise Agent Platform(旧 Vertex AI)での Claude Opus 4.8 の機能紹介と、Gemini Enterprise Agent Platform で Opus 4.8 を実際に利用してみました。
Gemini Enterprise Agent Platform(旧 Vertex AI)ですでに Opus 4.7 を利用されている方は、モデル ID を claude-opus-4-8 に変更するだけですぐに Opus 4.8 を利用することができます。
Google Cloud 上で利用する利点は、こうしたモデル性能をエンタープライズグレードのインフラと組み合わせられることです。VPC Service Controls によるネットワーク制御、Provisioned Throughput による安定したスループット確保、Prompt Caching によるキャッシュ読み取りトークン最大 90% オフなど、本番運用に必要な機能がそろっています。
コーディング支援・法務レビュー・財務分析・長期エージェントなど、精度と信頼性を求めるユースケースでぜひ活用をご検討ください。
この記事が誰かの助けになれば幸いです。
以上、クラウド事業本部コンサルティング部の渡邉でした!








