[レポート] Amazon Fraud Detectorの紹介: オンライン不正検出のより迅速な検出 #AIM322 #reinvent

この記事は re:Invent 2019 AIM322 Introducing Amazon Fraud Detector: Detect more online fraud faster のレポートです。

AWS re:Invent 2019

#AWS

佐々木一洋

2019.12.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

この記事は re:Invent 2019 AIM322 Introducing Amazon Fraud Detector: Detect more online fraud faster のレポートです。発表のスライドと動画はこちらで公開されています。

セッション概要

Looking to protect your company and your customers from online fraudsters? This session details how to implement a customized fraud detection solution for online activities using machine learning, how to proactively identify these use cases, and how to implement changes to protect your company and customers.

スピーカー

Nick Tostenrude - Senior Manager, Product Management - Tech, Amazon Web Services
Ryan Schmiedl - GM, Fraud Prevention, Amazon Web Services
Kara Suro - Vice President of Fraud and Financial Crimes, Charles Schwab

アジェンダ

不正検出と防止について
機械学習について
Amazon Fraud Detectorの紹介

不正検出と防止について

最初のパートではチャールズ・シュワブ社のSchmiedl氏が不正検出と対策について説明されていました。

詐欺にはあらゆる形態がある

不正な支払い
- 侵害された支払い方法(e.g. 盗難されたクレジットカード）
- 国際的な未払い(e.g. プリペイドカード）
アカウント乗っ取り
- ユーザー名/パスワード
- APIキー
不正利用
- 無料枠の誤用
- プレミアムナンバー（日本でいうダイアルQ2）

不正のタイプと手口

新アカウント
- 合成によるIDの生成
- ID盗難
アカウント乗っ取り
- 資格情報の盗難
- 新たな資格情報の生成
- パスワードリセット
支払い
- 小切手
- クレジットカード
- ACH(Automated Clearing House)
- デジタルウォレット
メールアカウント乗っ取り
- 個人/ビジネスメール
ソーシャルエンジニアリング
- フィッシング
- SMSフィッシング
- ボイスフィッシング
詐欺
- 高額購入
- 恋愛詐欺
- テックサポート

不正防止の戦略

Prevention(防止)
Detection(検出)
Remediation(復旧)
Containment(封じ込め)

機械学習について

ルールベース検出と機械学習の比較

ルールベースでは特定の条件や挙動に着目する
- ルールベースでは結果などの説明や検証が容易
機械学習では大量のデータを参照することで一般的なパターンを学習する
- 通常の顧客の挙動を学習しているため詐欺師が微細な変更を行っても検出ができる
- 機械学習はルールベースよりも危険なパターンを見つけるのが得意なだけでなく、ルールベースよりもロバストである

機械学習を使った不正検出プロセスのループ

不正利用へのラベルづけ
モデルの再学習と最適化
ルールの最適化

不正検出の難しさ

不正防止のために毎年数十億ドルの損出
詐欺師は頻繁に戦術を変更するので追従する必要がある
人力によるコストが高いレビュー
変更ができないソリューションに組み込みの検知ロジック

一方で機械学習を使った検出もまた困難

機械学習の専門家は数が少なく、人件費も高い
一般的な検出モデルでは精度が不足
データの前処理に時間がかかる

Amazon Fraud Detectorの紹介

Amazon Fraud Detectorのメリット

高品質の不正検出 ML モデルをより迅速に構築
不正行為者を事前に阻止する
組み込まれたオンライン不正の専門知識
不正対策チームにさらにコントロールを与える

一般的なオンラインの不正の検出

企業における一般的なオンライン不正の検出を補助するために設計されている

例 - 不正な新アカウント作成 - オンライン支払い(coming soon) - ゲストチェックアウト - 「購入前にお試し」の濫用

どのように動作するのか

S3上にオンラインイベント履歴データをアップロードする
数クリックの操作で自動的にカスタムモデルが生成される
モデルから出力されるスコアを判断ロジックと組み合わせて、要確認やパスなどのアクションとする
Prediction APIをリアルタイム不正検出が行える

不正検出の方法

ゲストチェックアウトの例

顧客がWebサイトに購入に必要な情報を送信する
WebサイトがCustomized fraud detection endpointをコール（購入情報を送信）
スコアと判定結果（承認、拒否）を元に顧客に結果を表示する

主な機能

事前作成済みの不正検出モデルのテンプレート
カスタム検出モデルの自動生成
Amazonへの過去の不正な試行から学習したモデル
Amazon Sagemakerとの統合
過去のモデルと判定ルールをレビュー可能なインターフェース

利用開始に必要なこと

プレビューへサインアップする
モデルテンプレートに必要な過去データを準備する
- 少なくとも１万件のイベントが必要（多ければ多いほど良い）
- 不正利用と通常利用の両方を含む
- CSVフォーマットで保存する

所感

冒頭のパートでの詐欺行為の手口について説明していたのが興味深かったです。合成されたIDによるアカウント作成の不正などは確かに機械学習を使わないと防ぐのが難しそうですし、そのためのモデルの作成、運用に費用と時間をかけるのは企業にとっては本質的ではないのでそこにFraud Detectorの価値があるのだと思いました。