[Amazon Comprehend] 事例セッションでみる顧客フィードバックとAWSのテキスト分析サービスの具体的な活用方法 #reinvent #aim202

2020.12.02

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、Mr.Moです。

ついにre:Invent 2020が始まりましたね。本イベントではたくさんの新サービス/新機能の発表はもちろんですが、AWSのサービスを実際にビジネスの場で活用したユースケースのセッションも惜しみなく展開されます。

そこで本記事では、12/2(火)に公開された「Discovering insights from customer surveys at McDonald’s」のセッションから、テキスト分析に有効なAmazon Comprehend サービスの実際の活用方法を見ていきます。

Amazon Comprehendとは

Amazon Comprehend は、機械学習を使用してテキスト内でインサイトや関係性を検出する自然言語処理 (NLP) サービスです。構造化されていないデータには膨大な量の潜在的な宝物があります。お客様の E メール、サポートチケット、製品レビュー、ソーシャルメディア、広告コピーが、ビジネスの役に立つ顧客感情のインサイトを表します。Amazon Comprehend は機械学習を使用して、構造化されていないデータのインサイトと関係を明らかにします。このサービスは、テキストの言語を識別し、キーフレーズ、場所、人物、ブランド、またはイベントを抽出し、テキストがどの程度肯定的か否定的かを理解し、トークン分割や品詞を使用してテキストを分析し、テキストファイルのコレクションをトピックごとに自動的に整理します。Amazon Comprehend の AutoML 機能を使用して、組織のニーズに合わせて独自にカスタマイズされたエンティティまたはテキスト分類モデルのカスタムセットを構築することもできます。

また、Amazon ComprehendはAIサービスの分類に入るサービスなので導入が比較的簡単であるという特徴もありますね。そのあたりの詳しい情報は【AWSの機械学習サービスで広がる世界】のセッションがとても参考になるのでご視聴いただければと思います。

image.png

Amazon Comprehendの機能

image.png

現時点では下記の機能が提供されています。日本語にも対応しているのが嬉しいですね。

  • センチメント分析、感情分析:テキストの内容が肯定的、否定的、中立的、または混在かを判断する
  • エンティティ認識:抽出したエンティティから「人」、「場所」、「位置」などの分類を判断する
  • キーフレーズ抽出:文章中で繰り返し使われるフレーズなどから判断する
  • 言語検出:テキストの内容から自動的にどの言語であるか判断する(日本語を含む12の言語に対応している)
  • 構文解析:テキスト内の名詞や形容詞などの単語境界やラベルを識別する
  • トピックモデリング:対象となる一連のドキュメントから、関連する用語またはトピックを識別、グループ化し、どのドキュメントがどのトピックに属しているかをマップする

なお、Amazon ComprehendではAutoMLの機能も用意されており、データを用意すれば機械学習の専門的な知識が無くてもカスタムモデルを作成することが可能です。

Amazon Comprehendのメリット

なんといってもフルマネージドのサービスなので面倒な管理が不要というところでしょうか。また、Amazon Comprehendの機械学習モデルは自動的に改善・適用されるので、利用する側は特に何もしなくても精度向上の恩恵にあずかる事ができるのも良い点ですね。

実際のビジネスユースケースから活用方法を紐解いていく

ここでは、マクドナルドがAmazon Comprehendを使用して顧客調査からテキストを抽出および分析し、顧客の感情の傾向を明らかにしてビジネスの洞察に活用した時の事例を見ていきます。

[目的] なぜテキスト分析を実施しようとしたのか

非常に明確な目的で「顧客の声をより把握し、顧客体験を継続的に向上させたい」思いから来ていました。また、下記のような状態もあったようです。

  • 顧客からはアンケートやSNSなど通じてフィードバックが得られる状態であった
  • フィードバックのデータはかなりのデータ量になっており日々増え続けていた

顧客を理解するために必要なデータ量が既にあり、分析に移れる状態であったんですね。

[課題] テキスト分析をするにあたりいくつか立ちはだかった問題

分析するにあたってはいくつか課題があったようです。

  • 構造化されているデータでは無い点
  • テキスト分析するにあたりフィードバック文章が複雑すぎていた
  • グローバルな顧客を相手にしているため複数の言語に対応する必要があった

[選定] テキスト分析にAmazon Comprehendを採用した理由

数々の課題を乗り越えることができるサービスがAmazon Comprehendだったんですね。採用した理由は下記を上げています。

  • 複数言語をサポートしている
  • 非構造のデータに対応できる
  • すぐに導入して使うことができるサービスであった
  • フルマネージドのサービスであった
  • カスタムモデルが構築でき追加対応が可能

[導入] Amazon Comprehendの導入と残っていた課題への対応

下記のような仕組みを用いて導入したとのことでした。

  1. SNSなどからの生データは定期的にポーリングし、Amazon S3にロード
  2. S3のイベントトリガーで「前処理」を実施
  3. Amazon Comprehendを使用し、言語検出、センチメント、キーフレーズなど検出
  4. Amazon Comprehendの結果はAmazon Redshiftに保存し、クエリや可視化に利用
  5. レポートのダッシュボードとデータの可視化

上記2.の「前処理」についてですが、課題としてあったテキスト分析するには複雑すぎる顧客からのフィードバック(テキストデータ)。つまり文章をそのまま扱うと、その内容にはポジティブやネガティブな内容が入り乱れるので何かしら処置が必要であるということです。ここでは文章を分解し1つの文としてAmazon Comprehendにかけることにより、求めている結果が得られたとしていますね。また、固有の用語についてはカスタムモデルで解決できたとのことでした。

[結果]

上記の仕組みでAmazon Comprehendを導入したことで下記の有効な結果が得られたようです。

  • 顧客の声を把握できたことで効果的なプロモーションを行えている
  • ドライブスルーの顧客満足度スコアにて、不正確な影響を受けている原因の特定ができた
  • COVIDの状況下で、顧客対応に応じる従業員の適切なPPE(個人用防護具)の使用につながっている

まとめ

機械学習の導入においては、使ったら何か便利になりそうというイメージだけが先行してしまい具体的なビジネスでの活用の発想まで至らないというのがこれまで1つ課題としてあったのではないかと思います。今回のセッションのような具体的な事例があると活用のイメージも湧いてきそうですね。また、Amazon ComprehendはいわゆるAIサービスのため、導入が簡単であり運用コストも控えめな部類のサービスになります。まだ活用できていない眠っているテキストデータがある場合はこのAmazon Comprehendの導入を検討してみてはいかがでしょうか。

AWS re:Invent 2020は現在絶賛開催中です!

参加がまだの方は、この機会にぜひこちらのリンクからレジストレーションして豊富なコンテンツを楽しみましょう!

AWS re:Invent | Amazon Web Services

またクラスメソッドではポータルサイトで最新情報を発信中です!

AWS re:Invent 2020 JAPAN PORTAL | クラスメソッド

参考