[レポート]AIM352: クラウドソーシングを活用したビジネスプロセスオートメーション #reinvent

こんにちは、小澤です。

本記事は現地時間2018/11/26-30で行われたre:Invent 2018のセッション「Business Process Automation Using Crowdsourcing」のレポートとなります。

セッション概要

本セッションの概要は以下の通りです。

セッションタイトル:
 Business Process Automation Using Crowdsourcing


登壇者:
Mark Chien - GM of Requester for Amazon Mechanical Turk, Amazon Web Services
Andy Hilal - Product Manager, Indeed
DAVID FALCK - Executive Director, Food Genius, Food Genius / US Foods

セッション概要:
While technology continues to improve, there are still many things that human beings can do much more effectively than computers, such as performing data deduplication or content moderation. Traditionally, such tasks have been accomplished by hiring a large temporary workforce—which is time consuming, expensive, and difficult to scale—or have gone undone. However, businesses or developers can use Amazon Mechanical Turk (Mechanical Turk) to access thousands of on-demand workers—and then integrate the results of that work directly into their business processes and systems. In this session, learn how enterprises are using Mechanical Turk to scale and automate their human-powered workflow.
(テクノロジは引き続き改善されていますが、データ重複除外やコンテンツの管理など、人間がコンピュータよりもずっと効果的にできることはまだたくさんあります。 伝統的に、このような作業は、時間がかかり、費用がかかり、規模を拡大するのが難しい、または元に戻した大きな一時的な労働力を雇用することによって達成されました。 しかし、企業や開発者はAmazon Mechanical Turk(Mechanical Turk)を使用して何千ものオンデマンドワーカーにアクセスし、その結果をビジネスプロセスやシステムに直接統合することができます。 このセッションでは、企業がメカニカル・トゥルクを使用して人力で動くワークフローをスケール・アンド・オートメーションする方法を学びます。)

セッション資料は以下で公開されています。

セッションレポート

Amazon Mechanical Turkとは

Amazon Mechanical Turk(以下セッション資料に合わせてMTurkと表記)はAWS上でクラウドソーシングを行うためのサービスです。

クラウドソーシングは簡単に言うと裏側に大量の人間がいて、簡単なタスクを人海戦術で行う仕組みとなっています。

例えば、数万枚にも及ぶ画像があったとして、そこに映っているのがどの動物なのか判断するようなタスクを想像してください。 これは、現在では機械学習を使った画像認識で簡単にできそうな気がします。 しかし、機械学習をするためには学習で利用する大量のデータが必要になります。 このデータには"画像"と"どの動物なのかの正解ラベル"がセットで必要になります。 この時の流れとして

  1. 画像と正解ラベルのセットを大量に用意する
  2. それらを使って機械学習を行う
  3. 機械学習のモデルを使って画像に映ってる動物を推論する

という流れになります。 3まで到達すれば以降は非常に簡単にラベル付けできるようになりますが、前段の工程のとして1を実現する必要がありますが、非常に多くの時間と手間がかかる作業となります。 そういった場面でクラウドソーシングを活用すれば低コストで多くのデータの取得が可能となります。

クラウドソーシングを提供するサービスによってはより複雑で高価なタスクの依頼が可能なものもありますが、一般的によく想像されるクラウドソーシングとしては1件あたりはすぐにできる簡単なタスクの場合が多いかと思われます。

MTurkでは、Marketplaceを経由して

  • タスクを依頼するリクエスタ
  • タスクを実行するワーカー

という役割に分かれてその仕組みを実現しています。

ビジネスプロセスオートメーションとは

続いて、ビジネスプロセスオートメーションとはどういったものなのかを見ていきましょう。

資料ではWikipediaからの引用で「複合的なビジネスプロセスを自動化するテクノロジー」として、必要となる要素に以下のような項目を挙げています。

  • 繰り返し行われるタスクの自動化と意思決定のルール化
  • プロセスを合理化し、精度と効率を向上させる
  • コストやオーバーヘッドを削減する
  • ビジネスの成長に合わせて規模を拡大していく

最近では日本でも「働き方改革」という言葉がよく聞かれますが、これらの項目からビジネスプロセスオートメーションはそれにもつながる内容であることがうかがえます。

MTurkを使ったビジネスオートメーションを実現するために考える必要がある項目としては以下のようになります。

  • プロセスを小さく簡単なタスクに分解できること
  • タスクを実行するのに必要なコンテキストは最小限にとどめ、売上に大きく貢献できる内容であること
  • 機密情報は含まないようにする

MTurkを使ったクラウドソーシングでは、都度ワーカーが割り当てられて簡単なタスクを実行することになるため、タスクは簡単である必要があるとともに、業界知識や社内用語など事前に知っておかなければならない知識は可能な限り含めないようにする必要があります。 また、第三者への依頼となるため、NDA締結などが必要となるような機密情報を含んだ内容は含まれないようにする必要があります。

MTrukでよくやられるタスクとしては以下のようなものがあります。

  • データの収集
  • コンテンツ管理
  • 画像・テキスト・音声・映像などから構造化に必要な情報の抽出
  • 分類
  • データが正しいかの検証

MTurkを使うことで、これらのような、1つ1つは簡単だけど大量に行う必要なあるタスクを低コストで実現できます。 また、ワーカーの人数も数多くいるため、時間や曜日の影響を受けずに常にタスクを実行可能です。

MTurkを使ったビジネスオートメーションの事例

いくつかの事例についての紹介がありました。 事例の中にはリアルタイムに情報を提示するための仕組みに組み込まれているものもあります。 クラウドソーシングというとバッチ処理のように一定量のデータに対してある程度時間をかけて行うイメージがありますが、MTurkではワーカー数も多いためリアルタイムな仕組みにも適用可能なことがわかります。

コンテンツ管理および分類

オンライン旅行サイトでの活用例となります。 実現したいこととしては、ユーザによってアップロードされたホテルの写真の管理と分類となっています。

ユーザによってアップロードされた写真をリアルタイムにMTurkに送ることで、ガイドラインに反したものでないかを確認するとともに分類が行われます。

これによってアップロードされた写真が公開される前に適切に管理された状態になり、関連のある別なホテルのレコメンドが即時可能になります。

営業アカウントデータの検証

こちらはオンラインの仕事検索サイトでの事例となります。

このサイトに登録されている会社の情報に関するデータの検証を行っています。 Salesforceに登録されているデータからウェブサイトの情報をMTurkに渡します。

MTurkを使って、サイトが現在も有効であるか、会社が買収されてないかといった情報を確認します。

この仕組みで、登録情報が古くなっていないかを効率的に確認することが可能になっています。

カタログ情報の検証

コンシューマ向けの旅行情報サービスでの活用事例です。

旅行者が旅行先でレストランを探す際におすすめレストランが"まだ営業時間の範囲内なのか"を調べる仕組みでMTurkを利用しています。 この仕組みではユーザにレストランをレコメンドする際にMTrukのワーカーによってウェブサイトから営業時間に関する情報を取得します。 これによって、旅行者はレストランに関する最新の情報を常に取得することが可能となっています。

災害後の被害状況確認

災害時の被害情報を迅速に取得するのにもMTurkが活用されています。

災害発生時に、建物なの被災状況MTurkを使うことで迅速かつ網羅的に取得することを目的としたものです。 MTurkのワーカーは、被災地の写真から被害状況を報告します。

これによって、建物ごとの被害状況を分類し、それに対してどのような活動を行うかの意思決定に役立てます。

より詳細な活用事例

Food GeniusとIndeedによる実際にどのようにMTurkを活用してるかの事例の発表がありました。

こちらに関しましては、資料中にどのように利用しているのかかなり詳細に書かれていますので、併せてご参照ください。

MTurkをビジネスオートメーションで実現する

MTrukでビジネスオートメーションを実現するには以下のようなプロセスが必要となります。

まず、Define workflowで全体像を定義します。

次にMTurk上でのタスクをどのように出すかのデザインをします。

その後、どのような能力を持った人がこのタスクに取り組んでほしいのかを"資格"という形で定義します。

ここまで出来たら、タスクを取り組み可能な状態にします。

実際に取り組んでもらった後はその結果を評価します。

最後に結果に基づいてプロセスを改善します。

おわりに

今回は「Business Process Automation Using Crowdsourcing」のセッションレポートを書かせていただきました。

機械学習を使ったシステムは日々進化しており、「人間の仕事がAIに奪われる」ということも言われる時代になっていますが、まだまだ人間でなければ難しいタスクは多く存在します。 MTrukを利用することでリアルタイムに近いタスクも実現可能となっています。

まずは、実現したいことを明確にした上でそのための手段として何を選択するのが考えていくことがこれからのビジネスの効率化には重要になるかと思います。