[レポート] 第1回 Amazon SageMaker 事例祭りに参加してきました(後半) #SageMaker 各社事例紹介
こんにちは、Mr.Moです。
本日は代休をいただきついでに、気になっていたコチラのセミナーにも参加してきました。 せっかくなので簡単にレポートにまとめたいと思います。
ちなみに前半は下記です。
[レポート] 第1回 Amazon SageMaker 事例祭りに参加してきました(前半) #SageMaker #reinvent アップデート情報復習
セミナー概要
Amazon SageMaker は、データサイエンティストやエンジニアが機械学習を行う上での効率を改善し、機械学習にとって重要なイテレーションの負荷を低減しています。 2018年5月より、東京リージョンでサービス提供が開始され、日本のお客様による検討、導入が進んでいます。 本セミナーでは、当該サービスの最新情報や技術情報、活用事例を提供するとともに、実際に導入頂いたお客様による「体験談」をお話しいただきます。
日時 | 2019 年 1 月 15 日(火 ) 開場: 13:15 開演: 13:45 ~17:30 |
開催場所 |
〒141-0021 東京都品川区上大崎3-1-1
|
アジェンダ | 13:45~14:30 Amazon SageMakerとは何か(45分) 14:30~15:15 Amazon SageMaker re:Inventアップデート(45分) 15:15~15:45 休憩(30分) 15:45~17:00 Amazon SageMaker 事例発表(各社様 20分程度) 17:00~17:15 Q&A |
Amazon SageMaker 事例発表
スマートニュース株式会社 様
【タイトル】SmartNews の機械学習ソリューションを次のステージへ 【概要】Amazon SageMaker により、機械学習のエキスパートが本質にフォーカスし、素晴らしいアウトプットを生み出すことが可能になります。世界中の良質な情報を届けるために、記事分類を始め、SmartNews はどうやって SageMaker を最大限に活用しているのか、紹介させて頂きます。
- SmartNewsサービスのご紹介
- 世界中の良質な情報ををユーザに送り届けるというミッションの元、アルゴリズムの力で記事を選び良質な情報を届けることを目指している
- AWS SageMakerがリリースされてすぐ社内でも話題になった
- その後、情報収集・検証を経て自社の機械学習環境を大きく変える可能性を感じ実際の導入に向けた動きがスタートした
- 最初のSageMaker導入を試みたケースはニュース記事の分類。ニュース記事に含まれる内容から「政治」、「スポーツ」などのカテゴリにわけること
- 努力の甲斐もあって一定の精度向上がみられた、しかし精度を維持するための対応も限界にきていた
- そこでSageMaker導入を機に新しい仕組みへと移行することに
- 以前は分類を伝統的なロジスティック回帰で行っていた、そこをCNNに切り替えた
- そうすることで必ずしも自然言語処理固有の知識が必要でなくなり、「ストオップワード」や「ステミング」といった前処理も不要になった
- SageMakerがノートブックやコンテナのセットアップなどを引き受けてくれるのでロジックに集中することが可能だった
- SageMakerは開発から学習、推論に至るまで全ての工程をサポートしており、その恩恵は大変大きい
- トレーニングデータを効率良く用意するために、figure eightというクラウドソーシングサービスも導入した
- 以前はビジネスロジックと機械学習のロジックは密結合であったためビジネスロジックと機械学習ロジック双方に詳しいエンジニアが必要であった
- SageMakerの導入により、ビジネスロジックから機械学習のロジックを分離できた
- SageMakerでは機械学習ロジックを利用するためのにエンドポイントを簡単に生成でき、ビジネスロジックはエンドポイントを介して機械学習のロジックを利用
- 機械学習エンジニアはアルゴリズムに集中でき、サーバーサイドエンジニアはビジネスロジックに集中できるようになった
- SageMakerの導入により、本質的な課題に集中できる体制ができた
株式会社ミクシィ 様
【タイトル】SageMakerに適した顔検出と安定運用の自動化 【概要】SageMakerを用いて高速化した顔検出のアーキテクチャと、自動化した運用パイプラインの紹介など
- アプリ(みてね)のご紹介
- ご両親が子供の写真を大量にアップロードし、それを祖父母にシェアするサービス
- コンテンツの自動生成機能あり。コンテンツ自動生成に顔認識技術が非常に重要であった
- 課題
- 厳しい要件をクリアしなければならなかった(7000万件メディアアップロード、ピーク時とのリソース消費差が激しい、低コスト化など)
- アーキテクチャの考慮
- マイクロサービス化(部分更新しやすいなど)
- 堅牢性
- 状況に応じたスケーリング
- 顔検出器の高速化必要性
- 本番導入までに10倍の高速化を実現しかければならなかった
- これらの課題を解決する環境をSageMakerのコンテナ上に展開できた
- オペレーションの問題
- スケーリングの問題
- SageMaker導入により下記写真に記載されている厳しい要件をクリアできた
株式会社FiNC Technologies 様
【タイトル】SageMakerと目指す機械学習の民主化 - FiNC秋の機械学習まつり
- FiNCアプリのご紹介
- ヘルスケアに特化したサービス。ECサイト、サブスクリプション、リアル店舗といった様々な形でサービスを提供
- なぜ機械学習に取り組むことになったのか
- 以前は企画ドリブンで技術的な観点で特に機械学習という選択肢がでる雰囲気が無かった、そこが課題であると感じていた
- 機械学習という選択肢や機械学習でできることを理解している状態を作れないかと考え、機械学習の民主化をしようと思い立った
- FiNC秋の機械学習まつりの開催(機械学習の民主化のため)
- 誰でも参加可能(実際に非エンジニアのアウトプットにも繋がった)
- SageMakerを利用(エンジニア以外も参加するため、SageMakerの特徴が活きた)
- 実装して、アウトプット提出(機械学習で何ができるのかを実際に体験してもらうため)
- アウトプットは評価して表彰(モチベーションUP、本番アプリに組み込まれるようなアウトプットが出るに至った)
- SageMakerを選んだ理由
- 各自の作業環境の影響を受けない
- エンジニア以外の様々なロールの社員も作業するため、ローカルな環境ではなくクラウド上に展開されている環境が望ましかった
- 作業環境の量産が簡単
- チームを組んでいて新たに人が入ってきても対応が容易
- AWSの他のサービスとの連携が簡単
- 自社のサービスがAWS上で動いている背景があり、AWSの機械学習サービスであれば連携もしやすい
- 機械学習まつりで民主化は進んだか
- 選択肢に機械学習がでるようになった
- エンジニアから機械学習が使えそうなポイントに対する意見がかなりでるようになった
- これまでの活動により経営者層にも機械学習への理解が広まり、全社的に機械学習に投資をしていこうという空気がうまれた
- 実際にSageMakerを使ってみた感想
- 環境構築が簡単でインフラエンジニアのコストを下げることができた
- コードの共有がしやく普段、機械学習のコードに触れていないエンジニアの助けにもなっていた
- サービスへのデプロイが非常に簡単
株式会社SIGNATE 様
【タイトル】SIGNATEにおけるAmazon SageMaker活用事例 【概要】日本最大AI開発コンペティションサイトであるSIGNATEでは様々コンペが行われております。その中の一つである「JR西日本 走行中の北陸新幹線車両台車部の着雪量予測」コンペで入賞したモデルをAmazon SageMakerベースに開発したSIGNATEのAI基盤システム上で運用しております。 本セッションではAmazon SageMaker導入理由や運用についてJR西日本様の事例を交えてお話しさせて頂きます。
- SIGNATEサービスのご紹介
- AI開発コンペティションサイトを展開。多くのデータサイエンティスト・AI技術者などが会員としてサイトに登録している
- 企業から出される課題に対し会員が応募、機械学習で課題を解決し会員同士でスコアを競う。高いスコアを叩き出し上位入賞した会員は企業から報酬が得られる
- コンペティションによるAI開発の課題
- 上位入賞者の機械学習コードを企業側が受け取ってもその後どう運用するのが正しいか分からない場合が多い(運用のフェーズで課題を抱えていた)
- SageMakerならトレーニングからデプロイまでサポートしている。デプロイの敷居が低くなったのは大きい
- 運用事例
- コンペティションの性質上、会員からどのようなアルゴリズム・データ・ソースコードが送られてくるか受け取るまで分からない
- こういったことに対応するプラットフォーム設計は非常に難しい
- SageMakerなら上記の問題も吸収できる
- とあるコンペティションにて
- コンペティション1位〜3位のモデルを同時に運用したいという要件が企業から出た
- SageMakerならこういった要件も簡単に実現すことができる(複数モデルの運用が可能)
- SageMaker導入メリット
- 様々なデータやアルゴリズムにも柔軟に対応できる
- 環境構築にDockerのコンテナが使用されているため、ビルトインからカスタマイズした環境まで対応可能
- 機械学習ワークフローに必要なツールが揃っている
- 2018年のre:Inventの発表でほぼ必要なツールが揃った印象
- メンテナンスコストが低い
- 少ない人数でも運用を回すことができる
- 実運用までの導入スピードが早い
- ケースによってはアルゴリズムを開発しても運用まで持っていくのに時間がかかることもしばしばあるため
まとめ
実際に導入されている各社様より説明いただいた「体験談」は非常に貴重な情報ばかりでした。 本日いただいた情報から、参加者による新たな導入事例が広がりそうな大変有意義なセミナーでした。