[アップデート] Amazon SageMaker HyperPod クラスターで P6-B200 インスタンスが利用可能になりました
こんにちは!クラウド事業本部コンサルティング部のたかくに(@takakuni_)です。
Amazon SageMaker HyperPod クラスターで P6-B200インスタンスが利用可能になりました。
P6-B200
P6-B200 とは、NVIDIA B200 Tensor Core GPU が搭載された AI のトレーニングおよび、推論ワークロードに向けの最新の GPU インスタンスです。
現状、p6-b200.48xlarge
のみのラインナップとなっており、p6-b200.48xlarge
では GPU が 8 基、1440 GB のメモリが搭載されています。
アップデート内容
タイトルの通り、今まで P6-B200 は SageMaker HyperPod クラスターでサポートされておらず、以下のブログのように Training Plans もトレーニングジョブでの提供となっていました。
Training Plans の SageMaker HyperPod クラスターで P6-B200 が利用可能
今回のアップデートによって、Training Plans でも P6-B200 を利用可能となりました。
What's New を見ると、利用可能なリージョンはオレゴン(us-west-2)リージョンのみのようですね。
The instances are available through SageMaker HyperPod flexible training plans in US West (Oregon) AWS Region.
オンデマンドはアカウントマネージャーへ要相談
SageMaker HyperPod の文脈だと、ここで言う on-demand reservation
はオンデマンド起動かと推測できますが、オンデマンドで起動したい場合はアカウントマネージャーへ別途相談が必要のようです。
For on-demand reservation of B200 instances, please reach out to your account manager.
コンソールを見てみる
Training Plans の画面および、Service Quotas の画面を見てみましょう。まずは Service Quotas から。
オレゴンリージョンの場合、ml.p6
と検索をかけるといくつか出てきていますね。バージニアやオハイオには、まだ Number of ml.p6-b200.48xlarge instances in reserved capacity across training plans per Region
の項目がないため起動できなさそうな印象です。
オレゴン
バージニア
オハイオ
続いて、Training Plans をみてみます。確かにオレゴンリージョンの Training Plans で p6-b200.48xlarge
が選択できるようになっています。
オレゴン
バージニア
オハイオ
試しに 1 台で 2 週間を選択すると、オファーが表示されました。
需要と供給のバランスで変化しますが、今回は 1 台あたり 58.17 USD/h で借りられそうでした。
インスタンス 8 台などで試してみましたが、アカウントクォータ以上の台数をリクエストするとエラーが表示されるようになっていました。
まとめ
以上、「Amazon SageMaker HyperPod クラスターで P6-B200 インスタンスが利用可能になりました。」でした。
リージョンの制約はありますが、 P6-B200 使ってみたい!と言う方には朗報なのではないかと思いました。
クラウド事業本部コンサルティング部のたかくに(@takakuni_)でした!