【レポート】【re:Mars 2019】M18: 機械学習を使った人身売買との闘い #reMARS

せーのでございます。
只今私はAmazon初めてのAI・機械学習系カンファレンス「re:Mars 2019」に参加するため、アメリカはラスベガス「Aria Casino & Resort」に来ております。

このエントリでは「M18-Fighting Human Trafficking Using Machine Learning」についてレポートします。

スピーカーはThorn CEO、Julie Cordua氏、AWS Artificial Intelligence Director、Ranju Das氏です。

レポート

  • AWSと一緒に5年前から取り組んできた闘いとオンラインでの幼児の性的虐待について
  • AIについて話す前にまず人間について話したい
  • 子供の性的虐待は世界が始まる頃からあった
  • 技術の進歩により、虐待も加速した
  • この20年でオンライン上で子供の売買市場が出来上がり、オンラインで買い物をするように売買が行われている
  • 昨年米国だけで4500万人以上の子供の性的虐待の画像とビデオが国立センターに報告された
  • それはたった12社のハイテク企業からだった
  • 新たな傾向としてライブストリーミングでの性的虐待
  • 10年前に私たちはソフトウェア会社を作り、現在38カ国で運用している
  • 今日はアメリカとカナダでの人身売買について話す
  • 最も頻繁に報告される年齢は15歳、平均は14歳、報告された最年少は生まれたばかりの子
    • おそらく両親が人身売買業者で産まれた時点で売っていたことを意味する

  • 国外から来ていると思っているかもしれないが、全てアメリカの子供

  • 71%は父親が自分の人生に関わっていないと言っている
  • 母親と同居していた子供はその40%が精神的虐待を受け、25%は肉体的に暴力を受けていた
  • 35%は母親が薬物やアルコール中毒

  • 50%の子供たちが人身売買業者と会って1ヶ月で完全な信頼を得た
    • 大部分の子供たちが回復しても訴追することを望まない
  • アメリカ中にエスコートサイト(風俗斡旋サイト)がある
    • その広告は全て18歳以上と表示されているが11〜15歳の子供がいる
    • 皆、偽の名前をつけている
    • そのため2004年時点ではオンライン広告に載せられたと答えた人は38%だった
    • 現在の調査で75%ということがわかっている

  • これは実際のオンライン市場のスクリーンショット
    • 見た目はスポーツ欄として隠れているが、裏にこういうページが隠れている
    • 毎日約150000の新しい広告が掲示されている
    • 摘発してページをダウンさせても、その倍のページが日々産まれている

  • AWSで使っている新しい機能は「認識できないテキストを検出する機能」
    • 広告のテキストが子供である可能性があるかどうかを判断するのに役立つ
  • 私たちには4年間のデータがある

  • 行方不明の子供の報告があったとする
  • 国立センターで子供の画像、電話番号、メールアドレス、名前、エイリアス、その他追跡に役立つ情報を入手する
  • データの一部が実際に埋め込まれた画像にあった場合、解凍してDBに戻し、そこにある他の情報とリンクさせる
    • 広告の5〜10%にテキストと画像が含まれている

  • スーパーボウルが人身売買の場所になっている
  • Facebookのフィードに行方不明の子供の写真が出てくる
  • 1万人以上の人身売買業者が9000人の子供たちに関わる37000件の事件に関与している
  • AWSの機械学習を使うことで現在、1日平均8人の子供を保護、回復させている
  • それでは技術的なサイドをRanjuに話してもらおう

Tech Side

  • Julieは素晴らしい仕事をしている。私とAWSチームはこの闘いの一部であることに感謝している
  • 社会をより安全にするために自分たちの使命は技術革新を起こすことと考えた
  • AWSで利用可能な種類のdepth, breadthを計算し、ストレージ、データベース、分析から始めると、簡単にこれらのソリューションを構築することが出来る
  • 私たちが世界を見る方法はいわゆる「Three layer cake」と呼ばれるもの
  • オープンで使えるフレームワーク、例えばcaffe, MXNet, TensorFlow, pytorch, chainなどがAWSで利用可能
    • 開発者は好きなフレームワークを選ぶことができる
  • ミドルウェアがより開発者の関心を寄せている
    • SageMaker
    • トレーニングサイクル、モデルの配置、調整を管理する
  • 最初のモデルは7-8ヶ月後にリリース
    • 80%は配管工事(plumbing)。顧客には直接関係のない部分
  • データをGround Truthを使ってラベリング
    • 学習させて共通するような画像を抽出させる

  • 私たちのチームは基礎的な作業を全て終え、シンプルなAPIを作成した

  • APIを呼び出せば使える言語サービス
    • Alexaの心臓部とも言えるLexと呼ばれるチャットボットサービスがある
    • あなたの組織から与えられたデータを元にニーズを予測するためのAPIを使う。とてもシンプルだ
  • 画像分析から進化してビデオから何が検出できるか話し合った
  • 居住地の検出が可能。例えばこの室内が会議室である、ということを認識してくれる
  • 顔分析。性別、年齢層、勘定、メガネ、サングラスなど
  • 顔認識。顔分析と似ているが違う。類似性を見つけ出し、Confidenceスコアとして表現する
  • データベースから似ている顔を検索する
  • ビデオから性的なものを暗示させたり性的に露骨な画像であることを伝える

  • テキスト認識。実は画像を調べるとテキストが沢山あることがわかった。興味深い
  • 機械学習で重要なのはアルゴリズムについてのConfidenceスコアを上げること。これで顧客が満足する可能性もあがる

  • コンテンツの管理。かなり重要

  • どうやって安全かどうかを判断するか。主観的で人によって違う
  • そのコンテキストが安全かどうかを見極めるため、階層的分類法を作成した。

  • 画像を見つけた時に明確にヌードであるか、とまず判断する
  • それを顧客がどう判断するかは別の話。危険と判断してフィルタリングすることもできる

  • 現在改善中の事柄。正面を向いたポーズ以外でも認識するように

  • 影が入ると認識が本当に難しくなる。照明が別角度であたっていても認識するように
  • 髪の毛が動き回っていても認識するように

  • 騙されたかと思うようなチャレンジングなテキストが沢山ある。これはテキサスの公有地で撮影したもの。異なるフォント。
  • 機械学習で最大に大事なのは、機械の決定に対して何らかの行動を取る前に、Confidenceのしきい値などを理解し、人間がレビュー する必要性を理解すること。

まとめ

前半は社会学の観点からの人身売買の実情と推移について、後半は画像を認識するテクニカルなサービス概要のお話でした。
人身売買や性的虐待なんて言うものは明らかな犯罪なので、決して見えないところで隠れてやっているのだと思っていたら、最近ではネットにそれらが溢れ出ている、という実情を知ってショックを受けました。またある時期から突然AWSのRekognitionにヌードに関する判断機能が出てきたのは、こういう案件が進んでいたからなのですね。大変勉強になりました。