[レポート] AIM206-干し草の山で針を見つける : AIを使用してコンテンツ管理を変革する #AIM206 #reinvent

2019.12.03

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

Finding a needle in a haystack: Use AI to transform content management

干し草の山で針を見つける:AI を使用してコンテンツ管理を変革する

スピーカー

Udi Hershkovich - Sr. Business Development Manager , Amazon Web Services Niranjan Hira - Product SA , Amazon Web Services Girish Arunagiri - Director, Technology , FINRA

セッション概要

Finding digital content, from documents to media, can be frustrating and time-consuming. Across your employees or customers, this challenge can waste hours, derail projects, and create poor experiences. In this breakout session, learn how to use language and vision AI services to extract data, insights, and trends from all of your digital content, with a focus on how to more effectively manage your documents and find what you need.

ドキュメントからメディアまで、デジタルコンテンツを見つけるのはイライラさせられ、時間がかかる場合があります。従業員であれ顧客全体であれ、この課題は時間を浪費させ、プロジェクトを脱線させ、劣悪な体験となります。この分科会では、ドキュメントをより効果的に管理し、必要なものを見つける方法に焦点を当てながら、言語および視覚の AI サービスを使用して、すべてのデジタルコンテンツからデータ、洞察、傾向を抽出する方法を学びます。

レポート

人気講義であったため拡張されたモニター会場でした。

はじめに

アジェンダ

  • どんどん増えていくヘイスタック=干し草の山
  • Deep Archives:この手のアーカイブは通常、大学の研究、メディア、Youtubeなどマネタイズアセットも該当します
  • Enterprise Knowledge:企業が持つ知識、その中には技術文書、NDAのようなも含む
  • eDiscovery:何か針のような物、証拠、膨大な量のe-メールもそれに該当する
  • Support:カスタマーサポートも、とてもヘイスタックになっている

問題の視点

ここで問題となるのは

  • 膨大な量がありすぎること
  • 読める状態にないこと
  • マルチメディアによって媒体が多くなっていること
  • 言語の壁

そこで一般的なコンテンツリポジトリをヘイスタックとして、これらからラムダのようなサーバーレスアーキテクチャの使って、AIサービスを使う仕組みを紹介する

AI/言語

Amazon Textract/Amazon Transcribe/Amazon Translateを使う

  • 特に言語について、このサービスでは15言語をカバーする
  • これらのサービスによって出力された結果をAmazon Comprehendで分析をする
  • NLP(Natural Language Processing)と呼ばれる

  • 最後にCorrelate Infer & Search

  • 鍵となるエンティティやフレーズ(人、場所、組織などで)を使う

  • Amazon Elasticsearch

  • Amazon Neptune
  • Amazon SageMaker

を使って成形する

多くの場合、これでカスタマーソリューションを作ることが出来る

Media Analysis Solution:パートナー

先にあった説明は非常に有用でコールセンターとか言語が増えても対応できる

Alfresco - Turning documents into insights

MARINUS ANALYTICS - 顔認証の会社 - Marinus Analystics uses Amazon Rekogniton to find human trafficking

lexbe - Analyzing millions of documents at scale - Amazon Translateを使ったサービス

  • これらのパートナーサービスで、干し草の山から針や証拠を見つけるに役立つ

Finra(フィンラ)

今回登壇した話者1人の所属会社でパートナー企業

  • Investor protection Market integrity
  • Enforce rules
  • Conduct examinations
  • Protect
  • investors
  • Educate investors

  • データはそれぞれ単独で取り扱うのではなく相関性を持っている

  • AIを使って関連するデータをブリッジする必要もある

  • 多くのE-mailの量

  • 時間が限られている
  • 最新の解析方法は限られている
  • バイアスによって選定がなされている

  • 実例としてE-mailをS3データに保管してあるとき

  • Amazon SageMakerを使って興味の対象を抽出

  • 結果として埋もれたデータにアクセスが出来て、60%の時間が削減できて、結果が得られる

まとめ

  • 埋もれたデータを掘り起こす
  • 機械学習を使う
  • Amazonは支援する