【レポート】「機械学習の実運用でよくある課題と, AWS を使った解決方法・事例紹介」 #AWSSummit

こんにちは、Mr.Moです。
2019年 6月 12日(水) 〜 14日(金) 幕張メッセにてAWSに関する情報交換やコラボレーション、学習を行うことができる日本最大級のカンファレンス AWS Summit Tokyo 2019が開催されています。

本記事では、AWSの機械学習系サービスを活用した事例と課題について語られるセッション『「機械学習の実運用でよくある課題と, AWS を使った解決方法・事例紹介」』についてレポートしたいと思います。

セッション概要

AWS のお客様は Amazon SageMaker をはじめとした AWS サービスを組み合わせることで、様々な機械学習ワークロードを実際に稼働させています。本セッションでは、AWSを使った機械学習の導入や運用にあたりよく出てくる課題を踏まえ、それらを解決するAWS サービスとクラウドのアーキテクチャについて、インターネットメディア、自動車、製造業など、様々な業界におけるお客様の事例を交えながらご紹介します。

スピーカー

アマゾン ウェブ サービス ジャパン株式会社
技術統括本部
ソリューションアーキテクト

宇都宮 聖子

セッションレポート

典型的な機械学習のワークフロー

データの取得から始まり、ここでいかに質の高いデータを確保できるかが重要。 そのデータを用いて実際にモデルの学習を行っていき学習後のモデルを評価していく。 ここまで完了すると本番環境へのデプロイを行い、実運用環境で期待したパフォーマンスが出せているかを監視・評価してさらなる改善をおこなう、こういったサイクルを回していく。 AWSではこのサイクルを高速かつ負担なく回せる仕組みを提供している。

よくある課題

トレンドの移り変わりが激しい機械学習の学習環境をスピーディーかつ定常的にエンジニアに提供していかなければならず、そして最新の研究成果もいち早く取り入れたモデルの構築・学習を行わなければならない。 さらに学習したモデルは利用できる形にデプロイせねばならずこの工程も速さが求められる。また本番環境稼働後のフィードバックをスムーズに受け取れる仕組みも必要、ワークフローに関しても組織の体制にあったを適切なものを考えなければならない。

Amazon SageMaker

Amazon SageMakerではAWSのユーザには機械学習の本当に必要なタスクのみに注力できるようにサービスを提供している。 Amazon SageMakerは主に6つのコンポーネントで構成されている。

学習データの収集と準備

データの準備段階で、学習データに対するアノテーション作業を支援するサービスを提供している。

MLアルゴリズムの選択と最適化

取得したデータに対しアルゴリズムを適用を考える際に、Built-in-AlgorithmやML in AWS Marketplaceといったものを利用すると、ゼロからではなくある程度出来上がりの機械学習のアルゴリズムを使うことができる。

学習環境の整備と運用、分散学習、HPO(ハイパーパラメータ最適化)

学習にかかるプロセスの自動化、SDKから提供される所定のメソッドをコールするだけでこういった自動化の恩恵を受けられる。

本番環境へのデプロイ、本番環境での運用とスケーリング

コードをたった1行書くだけでデプロイ処理が実施される。

事例紹介

機械学習を使ったサービスを迅速に構築(dely株式会社)

kurashiru レシピサービス。 機械学習エンジニア一人という体制にもかかわらず、1.5ヶ月という短期間でプロダクションへのリリースを実現。 Amazon Sagemakerの「Build-in Algorithms」を活用して迅速なサービス導入を実現した。

社内のML開発環境の統一(スマートニュース株式会社)

SmartNewsアプリサービス。 社内の研究チームとプロダクションチームの環境の壁(それぞれが独自に構築していた環境)があり、Amazon SageMakerを利用することで環境の統一に成功。その結果無駄が減りよりそれぞれの専門タスクに注力できるようになった。

クラウド上での学習環境の一元管理(株式会社シナモン)

グローバルなAIリサーチャー拠点に対する課題。 海外に点在している拠点においてもAmazon SageMakerの導入によりGPU学習リソースの一元管理や学習環境の統一に成功。その結果、開発効率を加速することができた。

AIサービスを実現する組織体制(株式会社ディー・エヌ・エー)

DRIVE CHART 商用車向け事故削減支援サービス‎。 3つの専門組織に分かれており(AI研究開発エンジニア、データサイエンティスト、MLエンジニア)、それぞれの専門性を最大化するような環境をAmazon SageMakerにより実現。

ゲーム開発への強化学習導入(株式会社ミクシィ)

定期的に生成されるゲームキャラクターのバランス調整に強化学習を導入。その際に強化学習に特化しているAmazon SageMaker RLを活用してクイックに開発・学習環境を構築した。 Amazon SageMaker RLは分散学習環境を簡単に構築することが可能。

新しい機械学習のアプローチ(SyntheticGestalt社)

Amazon SageMaker RLが本来やるべき作業のいくつかを吸収その結果、新しい取り組みに着手できる時間を捻出できた。

予防×ヘルスケア×テクノロジー (株式会社 FiNC Technologies)

Amazon SageMaker をフル活用して日々エンドユーザからアップロードされる大量のデータを取得〜学習、およびデプロイまでのサイクルを高速化。鮮度の良いモデルを実現している。

まとめ

Amazon SageMakerを利用すると、本来待ち構えている様々な課題が一気にクリアできて、最速でサービスローンチの実現が可能そうです。 また、サービスローンチ後継続できなアップデートのサイクルにも非常に強みを持っていそうですね。