[アップデート] Amazon SageMaker HyperPod の Flexible Training Plans に P6-B200 インスタンスがサポートされました
はじめに
LLM の開発において高性能な GPU リソースの確保が課題となっています。NVIDIA の最新 Blackwell アーキテクチャの GPU を搭載した P6-B200 インスタンスが、SageMaker HyperPod の Flexible Training Plans を通じて利用できるようになりました。
2025 年 5 月にリリースされた P6-B200 インスタンスですが、当初から近日中に Flexible Trainng Plans をサポートするとアナウンスされていました。そのアップデートがやってきました。
P6-B200 インスタンスとは
P6-B200 インスタンスは、NVIDIA の最新 Blackwell アーキテクチャを採用した NVIDIA B200 Tensor Core GPU を搭載した GPU インスタンスです。現在はオレゴンリージョンの 1AZ のみで提供されています。詳細は以下の記事をご参照ください。
しかし、高性能な GPU なりのお値段
2025 年 6 月 6 日に P6-B200 インスタンスがオンデマンド起動に対応したアップデートがありました。そこで、P6-B200 のオンデマンド価格が明らかになりました。
同日に発表された P5,P5en のインスタンスタイプの価格引き下げもあり、P5en.48xlarge の約 2 倍の価格設定です。1 時間$100 を超えてきます。
オレゴンリージョンの価格(2025/6/6)
Flexible Training Plans ならお安く使える可能性があるのではということで確認してみます。
SageMaker HyperPod Flexible Training Plans とは
サービスの概要
SageMaker HyperPod Flexible Training Plans は、大規模な AI モデルトレーニングワークロード向けのインスタンスのキャパシティを予約できるサービスです。従来のオンデマンドインスタンスでは確保が困難だった大量の GPU リソースを、事前予約によって確実に利用できるようになります。※ 支払いは事前に済ませる必要はあります。
利用料金は需要と供給によるので、オンデマンド料金よりも安く調達できるときもあれば、高くなる可能性もあります。
詳細は以下の記事を参照ください。
確認してみた
利用可能リージョン
現在、P6-B200 インスタンスはオレゴンリージョン(us-west-2
)でのみ提供されています。そのため、SageMaker HyperPod も同様にオレゴンリージョンを利用する必要があります。
マネージメントコンソールから価格をチェック
ml.p6-b200.48xlarge
が選択可能になっていました。丸 1 日利用を想定して予約を進めます。
6 月 9 日のトレーニングプランの価格は $57.05/時間でした。オンデマンド価格と比べると半額で利用できて大変お得です。
H100 Tensor Core GPU を搭載した p5.48xlarge のオンデマンド価格とほぼ同額で、最新の GPU を利用できることになります。
ml.p5.48xlarge の価格は
ml.p5.48xlarge のトレーニングプランの価格は $35.43/時間ですので約 35%割引でした。
単価だけみると安いですが、GPU の性能差があります。また、割引率も現時点では P6-B200 インスタンスの方が高くなっています。そのため、お得感は P6-B200 インスタンスに軍配が上がりますね。
SageMaker HyperPod クラスターは非対応
HyperPod クラスターの足回りは EKS です。現時点では、P6-B200 インスタンスはサポートしていない様子でした。P5 シリーズはエラーでないところみると、そのうちサポートされるのではないでしょうか。
まとめ
P6-B200 インスタンスが SageMaker HyperPod Flexible Training Plans で予約可能となりました。対応しているのはトレーニングジョブのみで、EKS を利用する HyperPod クラスターでの予約はできませんでした。
おわりに
最近ガッツリ GPU を利用する構成の技術支援をしていないので、GPU のキャッチアップ中です。GPU をぶん回していきたいです。それでは。