[レポート] Amazon Fraud Detectorの紹介: オンライン不正検出のより迅速な検出 #AIM322 #reinvent
はじめに
この記事は re:Invent 2019 AIM322 Introducing Amazon Fraud Detector: Detect more online fraud faster のレポートです。 発表のスライドと動画はこちらで公開されています。
セッション概要
Looking to protect your company and your customers from online fraudsters? This session details how to implement a customized fraud detection solution for online activities using machine learning, how to proactively identify these use cases, and how to implement changes to protect your company and customers.
スピーカー
- Nick Tostenrude - Senior Manager, Product Management - Tech, Amazon Web Services
- Ryan Schmiedl - GM, Fraud Prevention, Amazon Web Services
- Kara Suro - Vice President of Fraud and Financial Crimes, Charles Schwab
アジェンダ
- 不正検出と防止について
- 機械学習について
- Amazon Fraud Detectorの紹介
不正検出と防止について
最初のパートではチャールズ・シュワブ社のSchmiedl氏が不正検出と対策について説明されていました。
詐欺にはあらゆる形態がある
- 不正な支払い
- 侵害された支払い方法(e.g. 盗難されたクレジットカード)
- 国際的な未払い(e.g. プリペイドカード)
- アカウント乗っ取り
- ユーザー名/パスワード
- APIキー
- 不正利用
- 無料枠の誤用
- プレミアムナンバー(日本でいうダイアルQ2)
不正のタイプと手口
- 新アカウント
- 合成によるIDの生成
- ID盗難
- アカウント乗っ取り
- 資格情報の盗難
- 新たな資格情報の生成
- パスワードリセット
- 支払い
- 小切手
- クレジットカード
- ACH(Automated Clearing House)
- デジタルウォレット
- メールアカウント乗っ取り
- 個人/ビジネスメール
- ソーシャルエンジニアリング
- フィッシング
- SMSフィッシング
- ボイスフィッシング
- 詐欺
- 高額購入
- 恋愛詐欺
- テックサポート
不正防止の戦略
- Prevention(防止)
- Detection(検出)
- Remediation(復旧)
- Containment(封じ込め)
機械学習について
ルールベース検出と機械学習の比較
- ルールベースでは特定の条件や挙動に着目する
- ルールベースでは結果などの説明や検証が容易
- 機械学習では大量のデータを参照することで一般的なパターンを学習する
- 通常の顧客の挙動を学習しているため詐欺師が微細な変更を行っても検出ができる
- 機械学習はルールベースよりも危険なパターンを見つけるのが得意なだけでなく、ルールベースよりもロバストである
機械学習を使った不正検出プロセスのループ
- 不正利用へのラベルづけ
- モデルの再学習と最適化
- ルールの最適化
不正検出の難しさ
- 不正防止のために毎年数十億ドルの損出
- 詐欺師は頻繁に戦術を変更するので追従する必要がある
- 人力によるコストが高いレビュー
- 変更ができないソリューションに組み込みの検知ロジック
一方で機械学習を使った検出もまた困難
- 機械学習の専門家は数が少なく、人件費も高い
- 一般的な検出モデルでは精度が不足
- データの前処理に時間がかかる
Amazon Fraud Detectorの紹介
Amazon Fraud Detectorのメリット
- 高品質の不正検出 ML モデルをより迅速に構築
- 不正行為者を事前に阻止する
- 組み込まれたオンライン不正の専門知識
- 不正対策チームにさらにコントロールを与える
一般的なオンラインの不正の検出
企業における一般的なオンライン不正の検出を補助するために設計されている
例 - 不正な新アカウント作成 - オンライン支払い(coming soon) - ゲストチェックアウト - 「購入前にお試し」の濫用
どのように動作するのか
- S3上にオンラインイベント履歴データをアップロードする
- 数クリックの操作で自動的にカスタムモデルが生成される
- モデルから出力されるスコアを判断ロジックと組み合わせて、要確認やパスなどのアクションとする
- Prediction APIをリアルタイム不正検出が行える
不正検出の方法
ゲストチェックアウトの例
- 顧客がWebサイトに購入に必要な情報を送信する
- WebサイトがCustomized fraud detection endpointをコール(購入情報を送信)
- スコアと判定結果(承認、拒否)を元に顧客に結果を表示する
主な機能
- 事前作成済みの不正検出モデルのテンプレート
- カスタム検出モデルの自動生成
- Amazonへの過去の不正な試行から学習したモデル
- Amazon Sagemakerとの統合
- 過去のモデルと判定ルールをレビュー可能なインターフェース
利用開始に必要なこと
- プレビューへサインアップする
- モデルテンプレートに必要な過去データを準備する
- 少なくとも1万件のイベントが必要(多ければ多いほど良い)
- 不正利用と通常利用の両方を含む
- CSVフォーマットで保存する
所感
冒頭のパートでの詐欺行為の手口について説明していたのが興味深かったです。合成されたIDによるアカウント作成の不正などは確かに機械学習を使わないと防ぐのが難しそうですし、そのためのモデルの作成、運用に費用と時間をかけるのは企業にとっては本質的ではないのでそこにFraud Detectorの価値があるのだと思いました。