【レポート】AWS Summit Tokyo 2019：Amazon SageMaker で好みのプロファイリングを爆速でつくった話 #AWSSummit

当エントリでは2019年06月13日に行われた『Amazon SageMaker で好みのプロファイリングを爆速でつくった話』に関する内容をレポートしたいと思います。

セッション概要

当セッションの登壇者及び概要は以下の通りです。

スピーカー：
株式会社エアークローゼット
プロダクトグループ
執⾏役員CTO兼プロダクトグループ⻑
辻亮佑
ユーザーサイドアーキテクトチームリーダー
松本裕太

セッション概要：
エアークローゼットは洋服のレンタルを通じてお客様に新しいお洋服とのワクワクする出会いを届けている。その中でもお客様の好みの理解は難易度が⾼く時間を要する。そこで今回 Amazon SageMaker を利⽤することで、爆速でお客様の好みのをプロファイリングをすることによってスタイリング精度、速度向上に貢献した。

セッションレポート

以下、セッションレポートです。

会社およびサービス紹介

（辻様より）

ミッション

「発想」と「IT」で人々の日常に新しいワクワクを創造する
Recruit | 株式会社エアークローゼット

サービス紹介

airCloset
- プロのスタイリストがユーザに合わせたコーディネートをお届け * 【公式】洋服レンタルならairCloset(エアークローゼット) | スタイリストがコーデする借り放題のファッションレンタルサービス
airCloset × ABLE
- airClosetの店舗版
- ファッションレンタルショップ｜ airCloset×ABLE（エアクロエイブル）
pickss
- パーソナルショッピングアプリ
- pickss - プロが「似合う」をピックする。パーソナルショッピングアプリ

airCloset

25万人超のユーザ
利用ステップ
- ユーザ情報や好みを連絡
- スタイリストから提案されたコーディネートが届く
- レンタルして楽しむ
登録情報
- 身長/体重、顔/全身写真、洋服のサイズ、好み、など
スタイリング情報
- スタイリスト、コーディネートされたアイテムの説明、など
フィードバック情報
- デザイン、着心地、カラー、サイズ感、等
データ活用のポイント
- ユーザ分類　※一番大切なところ
- 人と人や服と服のマッチング
- 倉庫、場所、ショップ
- など

airClosetにおける機械学習に関する取り組み

（松本様より）

自己紹介

エンジニアチーム（兼任）
- フロントメインでインフラ、サーバサイドも扱う
データサイエンスチーム（兼任）
- 経営層と意思疎通を行う為に社長室所属に
React Native、統計学が得意

既に機械学習を取り入れているサービス

退会検知
- 退会しそうなお客様を通知
- 行動→モデル→警告
- Doc2Vecを利用
- precision、recallの塩梅が難しい
- 70%程度の精度
返却数推定
- 7日後の返却数を推定し、倉庫内の人員配置を行う
- アイテム返却→倉庫対応
- 負の二項回帰、stepwise法
- 誤差12%以内に収まった
- GWや大雨など突発的な増減があった場合は外れる
- LSTM、状態空間モデルも試す予定

airClosetにおける機械学習の取り組み

スタイリングの将来的な課題
- お客様の増加に対してスタイリストの確保が難しい
ユーザープロファイリング
- スタイリングの効率化
- スタイリングの質の担保
- お客様理解→スタイリング
- AIによってお客様プロファイリングを効率化したい
スタイリストによるスタイリング
- お客様にとって似合う服
- お客様の現在の趣向
- お客様がなりたい自分
- →パーソナルスタイリング
お客様に似合う服をAIでレコメンドしたい
- 似合うとは？
  - ドメイン知識の習得
    - パーソナルスタイリストの作田麻衣子さん
      - イメージコンサルタント（米国大統領選でも使われている）
      - 心理セラピスト
      - airClosetスーパーバイザー
        
        4年間で1万件のスタイリング
    - ヒアリングの結果
      - 服には様々なベクトルがある
      - お客様にも同様のベクトルがある
      - これらによって似合うが決まる
      - 顔、目、骨格など
- やりたいこと
  - ユーザ情報+写真
  - スタイリングが決まる
    - 甘辛
    - モダ・トラ
    - 色味
- アノテーションで苦戦
  - 作業できる人が限られる（実質2人）
  - アノテーション作業専用のの独自UIを作成（改修3回ほど）
  - とにかく時間がかかる（1日でも50件）
  - ようやく700件のデータが集まった
- 機械学習
  - 開発
    - PyCharmで開発
    - data scientific mode
    - 5 epochで回す
  - 学習
    - SageMaker便利
    - gpuインスタンスを使って高速学習
  - 検証→開発→学習
  - 100回
- SageMaker
  - 結果としてはかなり助けられた
  - jupyterノートブック→学習インスタンス→S3
  - entry_pointのデバッグがなかなかつらい（やり直しに時間がかかる）
  - AWSサポート便利
    - PyTorchのサポートバージョンなどでハマったところ助けられた
  - 移行ハンズオンとかも良さそう
- モデルの推移
  - v1
    - OpenCVをつかって、顔認識させ、顔面期のパスを取得
    - 損失関数が全然下がらない、推定位置だいたい0近辺
  - v2
    - 顔パーツの比率に着目し、新たな指標を試す
    - ほとんど学習が進まなかった
    - 指標を作るのはあきらめた
  - v3
    - Resnet18を組み込んだモデル
    - Fine Tuning
    - 過学習になって落ちてるだけ
    - 教師データに対してMSEが高すぎる
  - v4
    - Resnet152
    - バッチ正則化も挟んだ
    - MSEが1以下まで低下
    - 実測値とのズレ、大きくハズレてしまうパターンがある
- 実測値とのズレの原因
  - 写真の質
  - 複数人写っている
  - 照明
  - 顔の向き
  - 画素数
  - →統一されたフォーマットである必要がある
- 課題
  - データ不足
    - テストデータと教師データ
    - データ数が足りない
  - 写真のフォーマットを固定したい
    - アプリの中でフォーマットする
    - 動的に顔認識させて正面かつ顔認識できる状態
- 展望
  - お客様のプロファイル分析だけでなく、似合うコーディネートの提案までをAIでできるところまでやっていく予定

まとめ

サービス改善の為に機械学習がどのように活用されているのか、AWS SageMakerの利用ポイントがよくわかるセッションでした。まだまだ課題もある中で、エンジニアがそれを楽しみ、改善していることが何よりも素晴らしいと感じました。引き続き、現場からのレポートを続けたいと思います。

【レポート】AWS Summit Tokyo 2019：Amazon SageMaker で好みのプロファイリングを爆速でつくった話 #AWSSummit

セッション概要

セッションレポート

会社およびサービス紹介

airClosetにおける機械学習に関する取り組み

まとめ

イベント

EVENT【5/29（水）大阪】Alteryxの使い方から導入メリットまですべてがわかるセミナー＆ワークショップ

EVENT【5/15（水）リモート】クラスメソッドの会社説明会を開催します

EVENT【5/8リモート】クラスメソッドのフリーランスエンジニア会社説明会〜フィンテック / リテール業界案件特集〜を開催します

EVENT【5/28（火）】AWSを最大活用するための1dayカンファレンス

EVENT【5/17（金）】認証機能の開発工数削減をデモで体験！次世代認証基盤サービス『Auth0 by Okta』導入実践ウェビナー

EVENT【5/14（火）】アノテーションの中途向けオンライン会社説明会を開催します

EVENT【5/23（木）】ユースケースに学ぶAWS運用のノウハウ～可視化から統制まで～

EVENT【5/16（木）】Snowflakeを触ってみよう！初めての方向けハンズオンセミナー

EVENT【5/10（金）名古屋】クラスメソッドグループの会社説明会を開催します！

EVENT【4/25（木）リモート】Google Cloudに携わるエンジニアのキャリア～クラスメソッド会社説明会～

【レポート】AWS Summit Tokyo 2019：Amazon SageMaker で好みのプロファイリングを爆速でつくった話 #AWSSummit

セッション概要

セッションレポート

会社およびサービス紹介

airClosetにおける機械学習に関する取り組み

まとめ

イベント

EVENT【5/29（水）大阪】Alteryxの使い方から導入メリットまですべてがわかるセミナー＆ワークショップ

EVENT【5/15（水）リモート】クラスメソッドの会社説明会を開催します

EVENT【5/8リモート】クラスメソッドのフリーランスエンジニア会社説明会 〜フィンテック / リテール 業界案件特集〜 を開催します

EVENT【5/28（火）】AWSを最大活用するための1dayカンファレンス

EVENT【5/17（金）】認証機能の開発工数削減をデモで体験！次世代認証基盤サービス『Auth0 by Okta』導入実践ウェビナー

EVENT【5/14（火）】アノテーションの中途向けオンライン会社説明会を開催します

EVENT【5/23（木）】ユースケースに学ぶAWS運用のノウハウ～可視化から統制まで～

EVENT【5/16（木）】Snowflakeを触ってみよう！初めての方向けハンズオンセミナー

EVENT【5/10（金） 名古屋】クラスメソッドグループの会社説明会を開催します！

EVENT【4/25（木）リモート】Google Cloudに携わるエンジニアのキャリア～クラスメソッド会社説明会～

関連記事

SageMaker Ground Truthのパフォーマンス可視化を調査した

SageMaker StudioのCode Editor Spaceをカスタムイメージで起動する方法

SageMaker StudioのJupyterLab Spaceをカスタムイメージで起動する方法

Amazon SageMaker CanvasのReady-to-useモデルからAWSのMLサービスを利用する

EVENT【5/8リモート】クラスメソッドのフリーランスエンジニア会社説明会〜フィンテック / リテール業界案件特集〜を開催します

EVENT【5/10（金）名古屋】クラスメソッドグループの会社説明会を開催します！