[レポート] AIM307: Deep Dive on Amazon Rekognition #reinvent

はじめに

本記事はAWS re:Invent 2018のセッション「AIM307 - Deep Dive on Amazon Rekognition」のレポートです。

Join us for a deep dive on the latest features of Amazon Rekognition. Learn how to easily add intelligent image and video analysis to applications in order to automate manual workflows, enhance creativity, and provide more personalized customer experiences. We share best practices for fine-tuning and optimizing Amazon Rekognition for a variety of use cases, including moderating content, creating searchable content libraries, and integrating secondary authentication into existing applications.

スピーカーは以下の3人。

  • Jon Turow - Head of Product, Amazon Rekognition
  • Rudi De Sousa - Director or Engineering and Architecture, News UK & Ireland Limited
  • Tom Jacques - VP Engineering, Tinder

レポート

Amazon Rekognition
 機械学習ベースのサービス
 イメージとビデオを分析
 イメージから人を抽出して分析する
 簡単に使えて低コスト、高可用性
 
ユースケース
 Media Discovery
  ライブイベントのブロードキャスティング
  メディアライブラリからの分析
  ソーシャルメディア分析、マーケティングに活用
  有名人分析、イメージやビデオからクイックに有名人を判別
  オブジェクトとシーンの分析
  新機能
   バウンディングボックスでの表示
    オブジェクトの数のカウントやオブジェクトの関係性を確認出来る
   テキストの分析
    イメージからテキストを抽出
    レイアウトやフォントに依存しない
    -90度から+90度まで認識可能

Tinderの事例
 どのようにRekognitionを使っているか
 Tinderはシングルの人たちのマッチングアプリ
 10ビリオン以上の画像が毎日アップされている
 Tinderのチャレンジ
  どんな相手が好きか
  どんな人とマッチングしたいか
  それらを機械学習で実現
 グローバルにスケールするサービス=AWSが最適
 写真は最も自然にエンゲージする方法
  文章を書くのはとても大変、写真は簡単に自分を伝えることが出来る
 Top Picks
  写真をピックアップしてレコメンド
  Top Picksとタグによってエンゲージメントが高まる
 Rekognitionの利用
  機械学習の専門家がいなくても簡単に画像が分析できる
  APIによって簡単に利用可能
  Rekognitionの分析結果から写真にTagを設定
   ハンバーガーとフライが写っていればFoodie、山と雪が写っていればアドベンチャー、等のようにラベル付
  Rekognitionによってタグ付け、Top Picksに掲載、ユーザーにレコメンドする
  Rekognitionを使うことで多くの課題が解決出来た

Rekognitionのコンテンツモデレーション
 safeとunsafeを判別するわけではない
 各カテゴリについてsocreで重み付け、何がsafeかは自分で判断する
 マッチングアプリcoffee meets bagelでは人的コストを97%削減

News UKの事例
 233年分のイメージコンテンツ
 イメージで保存された過去の記事を読み込むものが必要だった
 Professional Serviceを使ってPoCを実施
 Rekognitionであれば実現可能であることがわかった
 S3に保存されたイメージをLambda経由でRekognitionで分析
 次のチャレンジ
  他のワークフローでのRekognitionの導入
  大量に発掘されたメタデータの分析

カスタマーエンゲージメントのユースケース
 顧客分析
  Faceによって顧客の状況やアクセサリを判断
  顧客の感情を確認、HappyかUnhappyを確認するなど
 顧客確認
  Face matchingにより表情やポーズ等が違っても同じ顧客であることを判断
 ユースケース
  KSTAR GROUP
   Face TicketサービスをRekognitionで実現
   顧客の顔自体がチケットになる

Rekognitionの始め方
 とても簡単
 AWSのコンソールから数クリックですぐに使える

Rekognitionのリファレンスアーキテクチャ
 S3にイメージやビデオを保存
 LambdaでRekognitionのAPIをキック
 結果を通知
 ストリーミングビデオはKinesis video streams経由でRekognition Videoへ  

さいごに

Rekognitionの実際のユースケースは興味深かったです。特にKSTAR GROUPのFace Ticketは、実際に実現しているというのはすごいですね。