[レポート] 機械学習の4大ユースケースを対処するための経験の積み方 GPSBUS205 #reinvent

AWS re:Invent 2019 GPSBUS205 - Building ML practices to address the top four use casesのセッションレポートです。機械学習の主要な4つの手法(レコメンデーション、時系列予測、コンピュータービジョン、自然言語処理)の経験を積む方法についてのセッションでした。具体的には機械学習の適用方法を3つのレイヤーに分けて、それぞれの手法についてどのように取り組めばよいか解説していました。最後に機械学習を適用するためのチートシートも紹介されれていました。

セッション情報

登壇者

  • Kristof Schum - Global Segment Leader of Machine Learning, Amazon Web Services
  • Prabha Ganapathy - AI/ML Sr Practice Leader, Amazon Web Services

概要

Although this Global Partner Summit session is open to anyone, it is geared toward current and potential AWS Partner Network Partners. In this session, APN Partners learn to build ML practices, increase margins, and accelerate time-to-market by leveraging AWS’s AI/ML stack depth with differentiable solutions for ML’s top four use cases: personalization and recommendation engines, forecasting, computer vision, and natural language.

レポート

アジェンダ

  • レイヤ化された学習戦略
  • レコメンデーション
  • 時系列予測
  • コンピュータービジョン
  • 自然言語処理

機械学習はなぜ難しいか?

  • 数学と技術だけでなく、ビジネスへの理解が必要
  • エンジニアとビジネスで協力する必要がある

レイヤー

  • AIサービス:事前学習済みのモデルを利用する。機械学習の知識がなくとも利用できる
  • MLサービス:データサイエンティストによって実際にモデルを作成する
  • フレームワークとインフラ:モデルの学習に特化したインフラとそのAWSインフラで利用する機械学習のフレームワーク

レコメンデーション

  • レコメンデーションの概要説明
  • MLスタック
  • Amazon Personalizeのユースケースと機能
  • Amazonにおけるレコメンデーションの取り組み
    • 最初はMatrix Factorizationから初めて、教師あり学習のDeep Learningを用いるようになった
  • Amazon Personalizeが内部的に利用するモデル
    • コールドスタートする際はユーザーに関する別のメタデータを渡すことでユーザー間の類似性を判定するようにできる
  • マーケットプレイスのモデルの紹介

時系列予測

  • 時系列予測の概要説明
  • MLスタック
  • Amazon.comにおける時系列予測
    • 185カ国あり、それぞれモデルを作る必要がある
    • 最初はランダムフォレストから始めた
    • カタログが大きくなり、地域性の考慮も必要になり機械学習を適用する
    • 最近はDeep Learningを用いている
  • Amazon Forecastが内部的に利用するモデル
  • GluonTSの紹介
  • マーケットプレイスのモデルの紹介

コンピュータービジョン

  • Amazon Rekognitionの紹介
    • この2年で色々なことができるようになっている
  • SageMaker Ground Truthの紹介
  • MLスタック
  • GluonCVの紹介
  • マーケットプレイスのモデルの紹介

自然言語処理

  • 対話(Chatbot)やコールセンター(その場で翻訳したり、センチメンタル分析したり)で利用する
  • Amazonの自然言語処理に関する各種AIサービス(Lex, Transcribe, Translate, Comprehend)の紹介
  • MLスタック
  • GluonNLPの紹介
  • マーケットプレイスのモデルの紹介

結論

  • 3層のアプローチで進める
    • 今回SageMakerはGluonについて紹介した
  • チートシート
  • データは必要になるが、まずはデータが必要のない学習済みのAIサービスから始める
    • マーケットプレイスにも学習済みのモデルがある
    • ビジネスを進めてデータが集まったら独自のモデルに取り組む
  • まずは簡単なところから始める

感想

機械学習に取り組む上でAWSのAIサービスとMLサービスの概要を把握できるよいセッションであったと思います。最後のチートシートも参考になると思います。なお、なぜかセッション開始時にストレッチを全員でやるという珍しいセッションでもありましたw