【速報】知識ゼロでもデータを用意するだけで機械学習が可能に。end to end MLサービス「Amazon SageMaker JumpStart」登場。 #reinvent

2020.12.10

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

せーのでございます。

今年のre:Invent 2020は機械学習が花盛りで、SageMaker系のサービスだけでも

  • Amazon SageMaker Data Wrangler
  • Amazon SageMaker Pipeline
  • Amazon SageMaker Feature Store
  • Deep Profiling for SageMaker Debugger
  • Amazon SageMaker Clarify
  • Amazon SageMaker Edge Manager

と、追いかけるだけで大変なことになっています。

ここでそのSageMaker祭りで疲れた体に水ビンタかますようなサービスが登場したのでご紹介します。

その名も「SageMaker JumpStart」です。

ここまできたか。。。

SageMaker JumpStartはオープンソースにある既にトレーニングされた機械学習モデルを、そのモデルを評価や追加学習、テストする環境も合わせてワンクリックで展開できるという、End-to-Endのサービスです。
つまり、人気の機械学習モデルを選んで、クリックして、あとは待っていれば、もう使える状態になる、ということです。もう殆ど機械学習に関して専門的に考えることがなくなっちゃいました。

さらにこのソリューションには自分たちが使いたいデータを用意すれば、それを使って転送学習することもできますし、ちょっと詳しい人は微調整することもできます。もちろんそのままでも動きます。

主な収録モデル

JumpStartは15のend-to-endソリューションにTensorflow hubやPyTorch hubなどにアップされている150以上のモデル、さらにAWSが今までのユースケースから作られた人気の高いビルトインアルゴリズムも使用できます。

もう既に全リージョンにローンチされているので、どんなモデルがあるのかのぞいてみましょう。

ソリューション

まずはend to end ソリューションを見てみます。

金融系の不正検出やクレジットカードの信用性の決定、センサーのメンテ用予知システムもありますね。Battlesnakeのための強化学習、、、これはAWSが作ったAIゲームですね。他にも需要予測やテキストの匿名化、手書き文字検出などがあるようです。

自然言語処理

つぎはテキスト用モデルです。

やはりBERTが一番に来ますね。後は今年発表されたBERTの後継と言われるELECTRAもありますね。
事前に学習させているデータセットはまあ当然というか英語のテキストが多いので、日本語で使うには転移学習が必要そうですね。

コンピュータビジョン

次は画像処理系です。

まず124個、という数に驚きます。中身はR-CNNやResnet, MobileNet, SSD, RetinaNetなど、一般的な画像分類、物体検出系のモデルはズラッと揃っていますね。
モデルが多いので上にある検索窓を使うとラクです。

他にもSageMakerのアルゴリズム、サンプルノートブックなどのAWSオリジナルコンテンツやブログにSageMaker Studioで動かせる色々な機能のチュートリアル動画なんかも揃っていて、ダッシュボードとしては必要十分が揃っている、という感じです。

後片付けもラクチン

ソリューションの展開などはCloudFormationを使っているので、削除した時はリソースをまるごと消してくれて、消し忘れもなくとても便利です。

まとめ

ということで軽く触りながらSageMaker JumpStartをご紹介しました。
コンピュータビジョンは手軽に使えそうで、機械学習の勉強を始めたばかりの方にはちょうどいいのではないでしょうか。

参考リンク