[アップデート] SageMaker Hyperpod の Flexible Training Plans が、即時開始と複数のオファーをサポートするようになりました

[アップデート] SageMaker Hyperpod の Flexible Training Plans が、即時開始と複数のオファーをサポートするようになりました

Clock Icon2025.03.08

こんにちは!クラウド事業本部コンサルティング部のたかくに(@takakuni_)です。

SageMaker Hyperpod の Flexible Training Plans が、即時開始と複数のオファーをサポートするようになりました。

https://aws.amazon.com/jp/about-aws/whats-new/2025/03/sagemaker-hyperpod-flexible-training-plans-instant-start-times-multiple-offers/

Flexible Training Plans

Flexible Training Plans は SageMaker HyperPod クラスターや SageMaker のトレーニングジョブで利用する GPU を予約する機能です。

指定された期間、予算内で高性能コンピューティングリソースへのアクセスを確保できます。re:Invent 2024 に発表された新しい機能です。

https://dev.classmethod.jp/articles/amazon-sagemaker-hyperpod-flexible-training-plans-reinvent2024/

アップデート内容

今回のアップデートは 2 つあります。

  • 即時開始できるようになった
  • 複数のオファーを繋げてオファーを組められようになった

即時開始

今まで Flexible Training Plans は早くても、翌日 or 当日の20時30分(UTC+9時間)を起点に利用開始できました。

たとえば、03月08日の20時35分にトレーニングプランを検索すると、早ければ03月09日の20時30分に開始と言った具合でのスタートでした。

03月08日の19時30分にトレーニングプランを検索する場合、よくて、当日の20時30分でしたが、ほとんどのケースでは翌日の20時30分と言った状況でした。

今回のアップデートで、20時30分の特定時間に左右されることなく、最短 30 分以内に予約を開始できるようになりました。

検索画面を見てみましょう。

時刻は03月08日の20時32分に撮影したスクリーンショットですが、以下のプランが提案されています。

  • 03月08日の21時02分に開始可能で、終了時刻が 03月09日の20時30分までの23時間28分利用可能なプラン(利用時間が1日に満たないプラン)
  • 03月08日の21時02分に開始可能で、終了時刻が 03月10日の20時30分までの1日と23時間28分利用可能なプラン(利用時間が1日を超えるプラン)
  • 03月09日の20時30分に開始可能で、終了時刻が 03月10日の20時30分までの1日利用可能なプラン(利用時間がちょうど1日の従来のプラン)

2025-03-08 at 20.37.01-Amazon SageMaker AI  us-west-2@2x.png

このように即時利用分として、20時30分を起点により柔軟にトレーニングプランを作成可能になりました。タイミングによっては 1 日に満たない利用(数時間の利用)もできそうです。

ただし、トレーニングプランを利用するには、プランを申し込み後、事前に支払いを済ませておく必要があります。今回の Immediately available とカテゴライズされるプランは、予約開始前の 5 分前までに支払い完了が必須のためご注意ください。

Plans marked Immediately available will start within 30 minutes, provided payment is completed no less than 5 minutes before the scheduled start time.

https://docs.aws.amazon.com/sagemaker/latest/dg/search-training-plan-offerings.html

複数のオファーの結合

今まで Flexible Training Plans は 1 つのオファーによって提供されていました。

たとえば、予約プール内で「ml.p5.48xlarge を 8 台、30 日間、03月09日から開始希望」を1つのオファーで組めるかどうかで判定していました。今回のアップデートで上記のリクエストを1つのオファーに加えて、複数のオファーで組めないか検索ロジックの変更がありました。

たとえば次のとおりです。

希望

ml.p5.48xlarge を 2 台、30 日間、03月09日から開始したい

従来

  1. ml.p5.48xlarge を 2 台、30 日間、03月09日から04月08日までの開始希望の1つのオファーで提供できるか探す
    1. できなければ別日で提案する(開始希望日に近い形で)

これから

  1. ml.p5.48xlarge を 2 台、30 日間、03月09日から04月08日までの開始希望の1つのオファーで提供できるか探す
  2. できなければ、分割した形でより開始希望日に近いオファーを提案を行う
    1. オファー例
      1. ml.p5.48xlarge を 2 台、10 日間、03月09日から03月19日までで提供
      2. ml.p5.48xlarge を 2 台、20 日間、03月19日から04月08日までで提供

https://docs.aws.amazon.com/sagemaker/latest/dg/reserve-capacity-with-training-plans.html#training-plans-considerations

実際の Trainings Plan の画面を見てみましょう。

ml.p5.48xlarge を 2 台、03月09日から利用したいケースで検索してみました。

Segment details が 2 segments となっています。

2025-03-08 at 21.00.11-Amazon SageMaker AI  us-west-2@2x.png

プランの内容です。2つのセグメント(オファー)でプランが構成されています。

0 minute interval と記載されているため、インターバルなしで利用を続けられるプランが提案されていますね。

利用者にとっては希望開始日に近い形でプランを組めるため、ありがたいです。

2025-03-08 at 21.01.37-Amazon SageMaker AI  us-west-2@2x.png

まとめ

以上、「SageMaker Hyperpod の Flexible Training Plans が、即時開始と複数のオファーをサポートするようになりました。」でした。

より Flexible Training Plans が迅速に柔軟になってきていますね。このブログがどなたかの参考になれば幸いです。

クラウド事業本部コンサルティング部のたかくに(@takakuni_)でした!

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.