ちょっと話題の記事

【速報】機械学習にもCI/CDの波が。Amazon SageMaker Pipelines 登場! #reinvent

2020.12.02

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

せーのでございます。

現在AWS re:InventではAndy Jassyのキーノートが行われています。

[随時更新] AWS re:Invent 2020 Keynote で発表された新サービスまとめ #reinvent | Developers.IO

ご機嫌いかがでしょうか、豊崎です。 今年もre:Invent 2020 キーノートではたくさんの新サービス/新機能が発表されるものと思います。 本投稿では、AWS re:Invent 2020のキーノートで発表された新サービスの記事をまとめます。 AWS re:Invent 2020では以下5つのキーノートが計画されています。 12/2: Andy Jassy Keynote 12/4: AWS Partner Keynote 12/9: Machine Learning Keynote 12/11: Infrastructure Keynote 12/16: Werner Vogels Keynote キーノート前に1つ大きな発表がありました。新たなEC2のインスタンス、Amazon EC2 Mac Instances が発表されました!実態としてはAWS Nitro Systemと連携したMac miniだそうです。起動には占有インスタンスが必要となります。 D3 / D3en Dense Storage Instances [詳細は別途Update] EC2 M5zn Instances - Fastest Intel

そこでSageMaker系で立て続けに新サービスが登場しましたので、速報でお知らせいたします。

SageMaker Pipelines

Amazon SageMaker Pipelines - Purpose-built CI/CD service for machine learning - Amazon Web Services

First purpose-built CI/CD service for machine learning Amazon SageMaker Pipelines is the first purpose-built, easy-to-use continuous integration and continuous delivery (CI/CD) service for machine learning. With SageMaker Pipelines, you can create, automate, and manage end-to-end ML workflows at scale. Orchestrating workflows across each step of the machine learning process (e.g.

SageMaker Pipelinesは機械学習における一連のワークフローを文字通りパイプラインとして管理できるサービスです。
機械学習はデータの準備から始まり、アルゴリズム、パラメータ調整、学習、調整、デプロイ、といったいくつかのステップで構成されています。
それらのステップを一連のワークフローとして捉え、自動化できるサービスがこの「SageMaker Pipelines」です。

ワークフローの作成、管理

一連のステップをグラフィックにまとめ、ワークフローとして俯瞰的に管理することができます。

モデルのバージョン管理(model registory機能)

追加学習やData Augmentationなどによりそれぞれ特性の違うモデルのバージョンを作ることがよくあります。model registory機能を使うと、モデルのバージョン管理ができ、要件ごとに異なるバージョンのモデルを選択できます。

監査証跡

ワークフローのすべてのステップをログに記録し、トレーニングデータ、プラットフォーム構成、モデルパラメーター、学習勾配などのモデルコンポーネントの監査証跡を作成できます。
そこからモデルの再作成なども可能なので、企業のコンプライアンス要件をクリアする時に必要に応じて対応できます。

まとめ

SageMaker Studioという統合IDEに続き、このCI/CDサービスは待ちに待っていた方もいるのではないでしょうか。
使いこなせば生産性が上がることは間違いなさそうです。詳しい情報が分かり次第またお伝えします!