[レポート]AIM214-R1 – 機械学習のための初のIDE、Amazon SageMaker Studioの紹介 #reinvent

どうも、DA事業本部の大澤です。

本エントリはAWS re:Invent 2019のセッション「AIM214-R1 - [NEW LAUNCH!] [REPEAT 1] Introducing Amazon SageMaker Studio, the first full IDE for ML」のレポートです。

セッション概要

Machine learning (ML) is a complex, iterative, often time-consuming process. One difficult aspect is the lack of integration between the workflow steps and the tools to accomplish them. Join us as we introduce Amazon SageMaker Studio, the first full integrated development environment (IDE) for ML that makes it easy to build, train, tune, debug, deploy, and monitor ML models at scale. It pulls together the ML workflow steps in a unified, visual interface—since they’re performed and tracked within one environment, the non-linear and iterative nature of ML development is greatly simplified. You can quickly move between steps, compare results and adjust inputs and parameters, and iterate faster with Amazon SageMaker Studio.

意訳

機械学習は複雑かつ反復でしばしば時間がかかるプロセスです。難しい面の一つにワークフローのステップやツールそれぞれが統合していないことがあります。機械学習のための初めてのフル統合開発環境であるAmazon SageMaker Studioの紹介に参加してください。Amazon SageMaker Studioは大規模な機械学習モデルの構築や学習、チューニング、デプロイ、監視を簡単にします。一つの環境で処理されトラックされているので、MLワークフローのステップを統合して、ビジュアルインターフェイスで連携させます。非線形で反復的な機械学習開発は非常に簡単化されます。ステップ間を動かしたり、入力やパラメータを調節したり、繰り返しを早くすることがAmazon SageMaker Studioによって可能となります。

スピーカー

  • Sumit Thakur - Senior Product Manager - Technical, Amazon Web Services
  • sharath pasupunuti - Sr.Director of Engineering, Artificial Intelligence, 1977

レポート

なぜ機械学習なのか

  • 機械学習を使うベネフィット
    • より良いプロダクト
    • より良いオペレーション/操作
    • より良い意思決定
  • 機械学習の辛さ
    • モデリング
    • 計算リソース
  • 機械学習におけるワークフロー
    • データの収集と前処理
    • モデリング
    • 学習
    • 評価と最適化
    • アプリケーションへの組み込み
  • Amazon SagMakerでのワークフロー
    • Build
      • フルマネージドノートブック
    • Train
      • ワンクリックでの学習
      • 自動モデルチューニング
    • Deploy
      • ワンクリックでのデプロイ
      • 自動でのスケーリング
  • 機械学習は反復
    • モデルの作成と学習をDebug, compare, evaluateで繰り返す
    • 各学習ジョブは追跡可能なように設定する
    • 最も良いモデルをデプロイ
    • デプロイ後も品質を監視し、異常を検出する

Amazon SageMaker Studio

  • Introducting Amazon SageMaker Studio
    • Notebooks
      • 共有可能なノートブックをクイックに開始可能
    • Experiments
      • 学習ジョブをトラック&管理し、ジョブ/モデルの比較が可能
    • Debugger
      • モデルの学習状況を監視&分析し、異常をチェック
    • Model Monitor
      • 運用モデルの推論状況を監視&分析し、異常をチェック
  • Quick Start Collaborative Amazon SageMaker Notebooks
    • Single Sign-on
    • Secure
    • 計算環境の切り替え
    • ワンクリックでのノートブック共有
    • ノートブックの再現
  • Amazon SageMaker Experiments
    • 実験の追跡と管理
    • 実験の比較
  • Amazon SageMaker Debug
    • フレームワークに対応
    • モデルを検査
    • ボトルネックが見つかった時はリアルタイムアラートを提供
    • 自分でデバッグルールを書ける
  • Amazon SageMaker Model Monitor
    • データ収集
    • 推論に使用したデータの分析
    • 分析したデータをもとにエンドポイントをモニタリング
    • アラートを設定可能
  • Amazon SageMaker Autopilot
    • テーブル形式のデータに対応
    • 回帰と分類に対応
    • 特徴量作成、モデル選択、パラメータ最適を自動で行う
    • 自動的に実験として追跡
    • ノートブックを取得できる

デモ

Amazon SageMaker Studioでの各機能が実際の画面とともに紹介されました。

GE Healthcare

  • インドは二番目に人口が多い
    • ~74kの子供が1日にうまれる
    • ~50kの子供が田舎で1日にうまれる
  • 出産には超音波を使用するが、超音波の技術は使用者に依存する
    • トレーニングが常になされるとは限らない
  • ヘルスケアはAIを使える箇所が多くある
  • 医療の現場において、データは大量に集まる
    • そのデータを活用すればいい
  • Edison AI Servide
    • 医療機器からデータを集める
    • LambdaやDynamoDB、Storage Gateway、SNS等を組み合わせてIngestする
    • JupyterやCloudFront、Database Migration Service(DMS)等でキュレーションする
    • SageMakerやDMS等を活用し、MLモデルを学習する
    • SageMakerとCloudFront等を活用しモデルをホスティング

さいごに

AWS re:Invent 2019のセッション「AIM214-R1 - [NEW LAUNCH!] [REPEAT 1] Introducing Amazon SageMaker Studio, the first full IDE for ML」のレポートをお伝えしました。先日Amazon SageMaker Studio がリリースされてかなり楽しみなセッションでした。各構成要素の丁寧な説明があり、理解が深まりました。

参考