【レポート】機械学習の導⼊前に検討しておきたいこと #AWS-56 #AWSSummit

2021.05.12

この記事では、5月11日に行われた AWS Summit Online 2021 のオンラインセッション『機械学習の導入前に検討しておきたいこと(AWS-56)』の模様をレポートします。

セッション概要

ビジネス課題の解決の手段として機械学習の利用を検討する際に、事前に考慮しなければいけない事項を数々の機械学習の課題をお客様と共に解決してきた Amazon Machine Learning (ML) Solutions Lab のメンバーが紹介します。そもそも、機械学習が適用できるビジネス課題はどういったものなのか、どういう課題を解決したいのか、どのような機械学習の手法を用いるのか、機械学習の導入による費用対効果(ROI)をどう考えるのか、事前にどのような情報が必要なのかと言った検討事項を解説します。

登壇者

  • アマゾン ウェブ サービス ジャパン株式会社 アマゾン マシンラーニング ソリューションズ ラボ データサイエンティスト 新井 達也
  • アマゾン ウェブ サービス ジャパン株式会社 アマゾン マシンラーニング ソリューション ラボ ディープラーニングアーキテクト 中山 洋平

レポート

Agenda

  • 機械学習で解決できることとは
  • アイデアから現実化までの道筋

機械学習で解決できることとは

  • 画像認識させたい場合
    • 解決したいビジネス課題に適したデータ、アルゴリズム、学習済モデルが揃っている
    • ただし、データやアルゴリズムが揃っていないと機械学習を扱えない

機械学習データとアルゴリズムの種類

  • 学習用データ
    • 表データ
    • 画像(分類)
    • 画像(物体検知)
    • 文書(分類)
    • 時系列データ
    • グラフ
  • 教師あり学習
    • すべての学習データは対応するラベル(正解データ)が必要
    • 分類、回帰の問題などに適している
  • 教師なし学習
    • データの類似性を判断するように学習されるためラベルは不要
    • クラスタリング、アソシエーション分析など適している
  • 強化学習
    • 特定の環境下で、⼀連の⾏動から学習
    • 価値の最大化や行動の最適化を得るのに適している

学習済モデルを利用したタスクやサービス

  • 画像処理
    • ⼤量の画像データで学習済みのCNNモデルで画像分類、物体検知
  • ⾃然⾔語処理
    • Wikipedia、学術論⽂、医学論⽂などで学習済みのモデルで⽂章分類、⽂章⽣成

独自で学習済モデルを容易できなくとも、AWSサービスには以下のような機械学習導入を支援するサービスがある。

アイデアから現実化までの道筋

  • オペレーションの⾃動化:⼈⼒のプロセスを機械学習で置き換える
    • 異常検知、翻訳、チャットBot、品質テストなど

  • データの理解、解析:機械学習を⽤いてデータの分析を⾏う
    • マーケティングへの活⽤、品質向上、カスタマーエンゲージメントなど

  • 時系列予測:意思決定に必要な情報を機械学習で予測
    • 需要予測、トラフィック予測、売上予測など

機械学習導入を成功させるための重要ポイント

  • ビジネスニーズを明確にする
  • 適切な機械学習のアプローチを選定する
  • 学習に必要なデータ揃える(学習に最適なデータに加工するプロセスも含む)

所感

深層学習(ディープラーニング)や強化学習が一般的に浸透してAIブームが再燃した際、「これまで解決が難しかったビジネス課題は、機械学習を導入すれば解決できる」と漠然と思っていた方がいらっしゃったかと思います。

しかし、そこでうまく成果を得るためにはデータを学習に扱いやすいよう加工する処理のほか、何よりも大事なのは解決したい課題を明確にし、どのような成果を得たいと考えているのか具体化しておくことです。そこが曖昧なままだと、機械学習を導入しても「思っていたのと違う」となってしまうでしょう。

以上のようなGapを抱かないためのポイントと実際に導入する際の考え方、利用できるAWSサービスは何かがわかるセッションでした。