【現地セッションレポート】 {New Launch} Introducing Amazon SageMaker Canvas #AIM233 #reinvent

2021.12.07

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

新規事業統括部の山本です。

AWS re:Invent 2021に参加し現地のセッションを受けてきたので、内容をレポートします。

今回は、キーノートで発表された新サービスの1つである、Amazon SageMaker Canvasのbreakoutセッションです。

発表内容まとめ

内容をまとめると以下のようでした。

  • No Codeで機械学習モデルを生成できる
  • データを可視化して前処理・分析ができ、生成したモデルによる推論の状況も確認できる
  • モデル生成に関するレポートが出力され、データサイエンティストやエンジニアに引き継ぐことができる

概要

セッションカタログの内容は以下の通りです。

Title: {New Launch} Introducing Amazon SageMaker Canvas

Code: AIM233

Session type: Breakout Session

Topics: AI ML

Session level: 200 - Intermediate

Amazon SageMaker Canvas is a visual, point-and-click service that makes it easy for business analysts to build ML models and generate accurate predictions without writing code or requiring ML expertise. In this session, learn how SageMaker Canvas makes it easy to seamlessly access and combine data from a variety of sources, automatically clean data and apply a variety of data adjustments, and create ML models to generate predictions with a single click. In addition, learn how you can use SageMaker Canvas to easily publish results, explain and interpret models, and share models with others within your organization to improve productivity.

発表内容

背景:機械学習(ML)によって、ビジネス価値を生み出す流れ

MLは時間がかかり、成果が出るまで数ヶ月かかってしまう

MLをスケールするには3つ

  • 現在のMLチームの生産性を上げる
  • ML開発チームの人員を増やす
  • MLを簡単にして扱える人を増やす。特にアナリストがモデルの生成までできるようにする(Democratizeする)← ここがSageMaker Canvasの目的

課題

  • アナリストはMLの知識がない場合がある、機械学習の知識や方法がわからない
  • 説明性がない、専門家による検証(確認・妥当性・有効性・保証)がない
  • 分析内容がわかりやすいNo Codeツールがない、料金が高い

提供サービス:Canvas

色々な機能がある

ユースケース:よくある機械学習の適用例。おそらく典型的な数値処理的なモデルを対象としてる(画像処理や言語処理などのモデルではなさそう)

デモ

画面上でCSVをアップロード

アップロードすると、自動で内容を分析し、良さそうな分析手法・モデルを選んでくれる模様

予測対象とするカラムを選ぶ

データの分布を可視化し、前処理・分析できる

モデル生成

→ データ内での精度や、特徴量の重要度を算出する

クイックビルドとスタンダートビルドがある

  • クイックはすぐにモデルを生成できる
  • スタンダードは1時間程度かかかる

各特徴量と出力の関係をグラフ化したり、正解・不正解、F1などの指標、混合Matrixの分析ができる

ここから2つできることがある

1つ目:レポートが出力される。以下の内容を含んでいて、アナリストからデータサイエンティストやエンジニアに引き継げる。

  • 入力データの内容(DataFrame・各指標)
  • データの保存場所(リンク)

2つ目:その場で実行できる(What-ifシナリオの話)

  • 数値を手入力して、モデルを実行する

ここから事例の話:EMW

No Cocde(SageMaker Canvas)によって、アナリストのドメイン知識を生かした分析ができた

始め方:以下のサイトにアクセスする。もしくはマネジメントコンソールから利用可能。

https://aws.amazon.com/jp/sagemaker/canvas/