Amazon SageMakerのノートブックインスタンス作成時にボリュームサイズが指定可能になってました

こんにちは、小澤です。

Amazon SageMakerにて内容は地味だけど、非常に嬉しい機能がいつの間にか追加されていたようです。 今回記載させたいただく、ノートブックインスタンスの作成時にボリュームサイズの指定です。

公式ブログでも紹介されていました。

使い方

どのように指定するか、と言ってもそのやり方は非常に簡単です。 マネジメントコンソールでノートブックインスタンを作成する際の項目として、「ボリュームサイズ」というものが追加されています。

記載されている通り、GB単位での指定となっており、5GB - 16TBまでの範囲で選択可能なようです。

AWSCLIから利用する場合は、create-notebook-instanceのオプションで--volume-size-in-gbを使ってサイズを指定できるようです。

どのような場面で利用できそうか

これまでノートブックインスタンスのディスクサイズは5GB固定でした。 機械学習を行う際には大量のデータを扱うことが多いため、これ以上のサイズのデータを扱う可能性はありえます。

SageMakerの構成から、ノートブックインスタンスでは学習や推論の処理は行わない想定のため、ディスクサイズ以外も含めてあまり高スペックのインスタンスは必要ありません。 データの量が多い場合はS3に保存すれば問題ないですし、大規模なデータに対する前処理を行いたければEMRやGlueが利用できます。

そうはいっても、使い慣れたPythonの各種ライブラリとJupyterを使ってEDAなどを行いたいなど、ノートブックインスタンス上で行えると非常に便利です。 今回、ボリュームサイズを設定可能になったことでこういった機械学習を行う過程で必須となる要素を含めた処理がSageMaker上でやりやすくなりました。

おわりに

簡単な紹介となりましたが、今回はSageMakerのノートブックインスタンスでボリュームサイズが指定可能になったことを紹介しました。 個人的にはこれは思わずにやけてしまうくらいものすごく嬉しい機能追加です。