Amazon SageMaker Studio で Training Plan による GPU キャパシティ予約が使えるようになりました

Amazon SageMaker Studio で Training Plan による GPU キャパシティ予約が使えるようになりました

2026.06.18

はじめに

2026 年 5 月 18 日、Amazon SageMaker Studio で Training Plan による GPU キャパシティ予約がサポートされました。

https://aws.amazon.com/jp/about-aws/whats-new/2026/05/amazon-sagemaker-training-plan-support-for-studio/

Training Plan は、ML ワークロード向けに GPU キャパシティを事前予約する機能です。これまではトレーニングジョブ、HyperPod クラスター、推論エンドポイントの 3 リソースが対象でした。今回のアップデートで SageMaker Studio が加わり、JupyterLab と Code Editor でも予約済みキャパシティを使えるようになりました。実際に多額の費用を投じて予約してみたができないのでドキュメントを記載をベースに詳細を確認した内容を紹介します。

なにが嬉しいのか

Training Plan の対象リソースに SageMaker Studio が追加され、JupyterLab と Code Editor を利用する際にも予約済み GPU キャパシティを使えます。昨今 GPU リソースの取り合いのため、事前にキャパシティを抑えておけることが大きいです。ですが、予約できるのは P 系インスタンスのため大規模な環境を想定されたものです。

Only JupyterLab and CodeEditor app types are supported with training plans.

出典: Using training plans in Studio applications - Amazon SageMaker AI User Guide

さらに嬉しいところで高額な GPU インスタンスですが、オンデマンド比で最大 65% の安く利用できます。実際の割引率はインスタンスタイプ、期間、時期で変わります。

Training Plan とは

Training Plan は、ML ワークロード向けに GPU または Trainium のコンピュートキャパシティを事前予約する機能です。インスタンスタイプ、台数、アベイラビリティーゾーン、期間を指定してキャパシティを確保し、対象リソースで消費します。

対象リソースは次の 4 種類です。購入後に変更できず、相互流用もできません。

Training plans are specific to their target resource (SageMaker Training Job, SageMaker HyperPod, SageMaker Inference endpoints, or SageMaker Studio apps) and cannot be interchanged.

出典: Reserve Flexible Training Plans for ML workloads - Amazon SageMaker AI User Guide

target resource 識別子 対象
training-job SageMaker トレーニングジョブ
hyperpod-cluster SageMaker HyperPod クラスター
endpoint SageMaker 推論エンドポイント
studio-apps SageMaker Studio(今回追加)

利用時の制約事項

Training Plan の制約について確認しておきましょう。

キャンセル・変更不可

  • 購入後はキャンセル不可
  • インスタンスの追加、削除による変更は不可(終了日の延長のみ可)
  • AWS アカウント間、Organization 内での共有不可

Training plan purchases are final and cannot be cancelled.
Training plans cannot be modified to add or remove instances; they can only be extended to a new end date.
Training plans cannot be shared across AWS accounts or within your AWS Organization.

出典: Reserve Flexible Training Plans for ML workloads - Amazon SageMaker AI User Guide

Studio 向けプランについては別のページでも、重要なことなので 2 回目の キャンセル不可 と書かれています。

Plans purchased for Studio apps cannot be cancelled.

出典: Using training plans in Studio applications - Amazon SageMaker AI User Guide

ターゲットリソースの変更不可

SageMaker Studio(studio-apps)として購入したプランは、トレーニングジョブや HyperPod クラスターには使えません。

The target resource of a training plan cannot be changed after purchase.

出典: Using training plans in Studio applications - Amazon SageMaker AI User Guide

前払いが必須

Training Plan はキャパシティの予約時に前払いです。予約済みキャパシティ上でアプリを起動中のコンピュート料金は別途発生しません。ただし、ストレージなどの関連リソース料金は通常通り請求されます。

Training plans are prepaid. You are not charged separately for compute time in the Studio app when running on training plan capacity.

出典: Using training plans in Studio applications - Amazon SageMaker AI User Guide

期限前の自動シャットダウンに注意

予約期間の満了の 30 分前に、稼働中のアプリが自動シャットダウンされます。 この 30 分間は課金対象外です。 ということは、前払いでここの時間分は払っていないということなのか!?細かいことはおいておいて、保存していない作業は失われますので小まめに保存しておくのが無難です。30 分は意外と短いです。

Apps running on training plan capacity are automatically shut down 30 minutes before the capacity block expires. Make sure that all your work is saved before the automatic shutdown. You are not charged for this 30-minute shutdown period.

出典: Using training plans in Studio applications - Amazon SageMaker AI User Guide

アプリを起動する VPC について

Training Plan で指定した AZ と同一 AZ のサブネットが Studio ドメインの VPC 設定に存在し、空き IP アドレスが 1 つ以上必要です。AZ が一致しないとアプリの起動に失敗します。

Make sure that the VPC configuration in your domain includes a subnet in the Availability Zone (AZ) specified in your training plan, with at least one free IP address.

出典: Using training plans in Studio applications - Amazon SageMaker AI User Guide

HyperPod 向けプランとの違いと予約価格

ここからは個人的に知りたかったことのまとめとなります。

Training Plan はターゲットリソースごとに購入しますが、予約価格の単価はターゲットリソース別に分かれていません。AWS 公式の価格ページでは「Amazon SageMaker HyperPod の柔軟なトレーニングプラン」という 1 つの価格表に統一されています。HyperPod 向けとトレーニングジョブ向けで参照する単価は共通です。

SageMaker_料金.png

参照: SageMaker 料金

一方、予約の仕組みにはターゲットリソースによる違いがあります。

For SageMaker HyperPod clusters:

  • Offerings are limited to a single Availability Zone (AZ).

For SageMaker training jobs:

  • Offerings can span multiple Availability Zones.

出典: Reserve Flexible Training Plans for ML workloads - Amazon SageMaker AI User Guide

target resource AZ 終了前のシャットダウン猶予
hyperpod-cluster 単一 AZ に限定 1 時間前
training-job 複数 AZ にまたがるオファー可(AZ 間の自動移動あり) 30 分前
endpoint 公式ドキュメントに明記なし 30 分前
studio-apps 公式ドキュメントに明記なし 30 分前

台数の選択肢(1、2、4、8、16、32、64 台)、期間(1〜182 日)、前払い、キャンセル不可といった制約はターゲットリソース共通です。

Capacity Blocks for ML との価格比較

GPU キャパシティの事前予約という点では EC2 Capacity Blocks for ML も選択肢です。同じ H100 搭載インスタンスで時間単価を比べると、Training Plan のほうが割高です。※ 2025 年 6 月時点のバージニア北部リージョン価格です。

調達方法 インスタンス 時間単価(参考値)
SageMaker Training Plan ml.p5.48xlarge 39.7992 USD
EC2 Capacity Blocks for ML p5.48xlarge 34.608 USD

SageMaker はプロビジョニングから障害復旧までを管理するマネージドサービスで、この管理コストが単価の差に含まれています。Capacity Blocks は EC2 インスタンスの素のキャパシティ予約のため、クラスター構築や障害対応は自前です。Studio アプリのように SageMaker マネージド環境で使うことが前提なら選択肢は Training Plan のみです。

まとめ

Training Plan で Studio アプリにも GPU キャパシティ予約が使えるようになりました。前払い、キャンセル不可の制約はいつもどおりです。

おわりに

最近、GPU を利用した相談が多いので事前に調べて勉強した内容のまとめでした。

参考

この記事をシェアする

AWSのお困り事はクラスメソッドへ

関連記事