[レポート] AIM312 Amazon Forecastによるビジネス成果の予想 – #AIM312 #reinvent

2019.12.08

はじめに

この記事はAIM312 Predict future business outcomes using Amazon Forecast のレポートです。

セッション概要

このセッションは昨年発表されたAWS Forecastのおさらいと事例の紹介でした。

Based on the same technology used at Amazon.com, Amazon Forecast uses machine learning and time-series data to build accurate business forecasts. In this session, learn how machine learning can improve accuracy in demand forecasting, financial planning, and resource allocation while reducing your forecasting time from months to hours.

スピーカー

  • Chris King - ML Specialist SA, Amazon Web Services
  • Rohit Menon - Sr. Product Manager, Amazon Web Services
  • Sean McCrary - Life Sciences Group, Supply Chain Analytics / Director, Thermo Fisher Scientific

Agenda

  • 時系列予測の使用場面
  • Amazon Forecastの概要
  • Amazon Forecastで使われているアルゴリズム
  • 時系列予測の評価
  • ケーススタディ: Thermo Fisherにおける余剰在庫の削減

時系列予測の使用場面

各分野で過剰・過小な予測は次のような問題を引き起こす

Impact of under and over forecasting

分野 過剰 過小
在庫計画 過剰在庫 販売機会の喪失
人材計画 人余り 残業代のコスト増
キャパシティプランニング 設備投資の無駄 供給不足
財務計画 キャッシュの枯渇 undercut

Amazon.comにおける予測

顧客の約束を果たすには正確な予測が不可欠

  • 品揃え、在庫管理: 毎日4億を超える製品の需要予測
  • 低価格: 低価格を顧客に提供するための在庫履行コストの削減
  • 迅速な配達: 12の配送オプションによる即日無料配送

予測のプロセス

予測には3つの標準的なプロセスがある

  • Looking backward: タイムスタンプと値を含む過去データによってベースラインを形成する
  • Identifying trends: 統計やDLによってデータのトレンドを抽出する
  • Projecting forward: ベースラインとトレンドによって将来の予測をする

Amazon Forecastを構成するスタック

Forecastは次のようなスタックから構成されている

Amazon Forecastの特徴

正確な予測のための自動機械学習サービスで次のような特徴がある

  • フルマージドサービス
  • 高精度
  • 使いやすい
  • モデルとデータをKMSのCMKで暗号化可能

予測に使用するデータセット

予測には3種類のデータを使用できる

  • ターゲットの値の時系列データ
  • ビジネスに固有の既知の時変データ(e.g. 商品の価格)
  • ビジネスに固有の非時変のメタデータ (e.g. 商品のタイプ)

Amazon Forecastで利用可能なアルゴリズム

  • ARIMA: 少数のデータでうまく機能する。自己相関をモデル化する古典的なアプローチ
  • ETS: 少数のデータでうまく機能する。傾向、季節性、および残差を見つける
  • NPTS: 断続的なスパイクに対して良好なパフォーマンスを発揮する
  • Prophet: トレンド、季節性、周期的、祝日の影響を見つけることができる
  • DeepAR+

予測結果の評価

  • Quantile: p90, p50の値を確認する(参考: re:Invent 2019直前のアップデートで任意の分位数を指定できるようになりました)
  • Loss metrics を確認する
    • Error/loss functions
    • Weighted quantile loss
    • RMSE
    • MAPE, MASE, log loss
  • バックテストを行う(過去データの異なる期間を対象に複数回テストする)

Thermo Fisher scientificでの事例

  • Thermo Fisher scientificはアメリカ合衆国マサチューセッツ州に本社を置く科学機器・試薬・科学サービス企業
  • 製造業において不正確な予測は費用増を招く
    • 過小な予想: 在庫不足や供給遅れ、追加の製造のための費用が発生
    • 過剰な予想: 過剰在庫と廃棄の費用増

実験

  • データ
    • 158,000のSKUからなる3年分の売上データ
    • 関連する時系列データとして販売価格の履歴、また商品のメタデータ
    • 20,000種のSKUを対象に実施
  • 評価
    • 評価のためバックテストを実施
    • 以下のメトリクスにおいて既存システムと比較
    • MAPE, WAPE, mean bias
  • 結果
    • MAPE accuracy 20%~89%(!)改善
    • 予測精度の改善は数百万ドルの在庫削減につながる

以下はスライドより結果の表

TCOの比較

所感

AWS Forecastを実際に使ってみたら精度はどうなの?と気になって参加してみました。 事例での実験結果では予測精度が改善された結果が紹介いましたが、他の実験結果や実際のオペレーションへのインテグレーション方法が気になるところでした。