[レポート]ALX301: 機械学習を利用してアレクサスキルの言語モデルをトレーニングする方法 #reinvent #alexa

[レポート]ALX301: 機械学習を利用してアレクサスキルの言語モデルをトレーニングする方法 #reinvent #alexa

Clock Icon2018.11.28

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、中村です。
ALX301: How to Train Your Alexa Skill Language Model Using Machine Learning のセッションレポートです。

概要

In order to create an engaging Alexa skill, you must have a well-thought-out language model for your voice UI. In this session, learn how to make your Alexa skill more delightful to customers by optimizing your language model, providing the correct training data for your custom intents, and using specific strategies to improve new and existing language models. Come prepared for an interactive conversation.

魅力的なAlexaスキルを作成するには、音声UIのための十分に考察された言語モデルが必要です。このセッションでは、言語モデルを最適化し、カスタムインテントに適切なトレーニングデータを提供し、また適当な方法で新しい言語モデルや既存の言語モデルを向上させることにより、Alexaスキルを顧客にもっと喜ばせる方法を学びます。

セッションリポート

  • SLU
  • ASR
    • Acpoustic modeling
    • Language modeling
      • pen と pin の認識
  • NLU Key concepts
    • Interaction Model
      • sample utterance を定義してインテントにマップする
  • Dialog Management
    • フローによってアレクサをより人間らしくする
  • interaction model は language model
    • 定義したものだけではなく、データトレーニングによって類似したデータも引っかかるようになってる
  • ASR 成功のための3つのキー
    • とにかくシンプルに
  • ビルドインスロットは数千のデータセットで
  • コミュニケーションで名前を使うためのデータが溜まってきたので、ビルトインで今後提供されるかも
  • ビルドインスロットの編集についてはフィードバックで受け付けている
  • AMAZON.FallbackIntent がsandboxで提供されている
    • Intent History で紐付けを確認できる
  • パターンマッチング例 - どっちのインテントとして認識される?
    • statistic modelは都度変わっていく(学習する)ので確認が必要
  • intent historyでは、インテントの確度もわかる
  • インテントにヒエラルキーはないが、カスタムインテントが優先的に引き当てられる(自分で定義しているから)
  • built-insの拡張をしてスキルに合わせてほしい
  • Dialog Management
    • 発話しそうな内容を設計する
    • エンティティ解決のためにシノニムを設定する
  • Intent history
    • スキルで利用された発話内容から解決されたインテントと角度がわかる
    • 発話内容の改善をする、ユーザーが1日あたり10人以上いないと使えない
    • SearchQueryはフリー取得できるが、特定の用途に最適化されたデータではないのでうまくいかない

終わりに

いかがでしたでしょうか。実際の仕組みを意識することなくスキル開発は可能ですが、より詳細な部分を設計し調整しておくことでより良いUXになると思います。時にインテント履歴自体は有用なものだと感じました。

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.