AWS re:Invent Tour – Seattle Session 「Amazon Echo & Alexa」レポート #reinvent

2015.10.06

re:Inventの特別コースとしてAmazon本社のあるシアトルに来ております。

社屋の一つである「Blackfoot」で「AWS re:Invent Tour - Seattle Session」という特別セッションが開催されました。

10:00 - 10:30 に行われた「Amazon Echo & Alexa【通訳セッション】」についてレ ポートします。

各セッションレポートにつきましては、以下をご覧ください。

  1. AWS re:Invent Tour – Seattle Session 「Welcome & Opening」
  2. AWS re:Invent Tour – Seattle Session 「Amazon Instant Video(プライムビデオ)」
  3. AWS re:Invent Tour – Seattle Session 「Amazon Echo & Alexa」 (当記事)
  4. AWS re:Invent Tour – Seattle Session 「Support Updates & Amazon Culture」

スピーカー

Sonil Ahuja, Software Development Engineer, Alexa Team

echo_presentation

Echo & Alexa

Echoとは、iPhone の Siri のように音声で命令できるデバイス。 Amazonでの購買、音楽再生などが最初から組み込まれています。 Alexa Skills Kitを使うとユーザー自身が音声コマンドを拡張できます。

echo/alexa architecture

音声技術には次の3つの重要なコンポーネントがあります。

  • ASR(automatic speech recognition): echo の入力を元に音声をテキストに変換します。
  • NLU(natural language understanding): 自然言語理解。意図を出す。Skillに渡される。
  • TTS(text to speech): ASR とは逆に、処理結果のテキストを echo で再生するために音声に変換します。

Alexa Skills Kit の開発について

Alexa Skill kitは無料で利用出来、SDK が公開されています。 音声コマンド(skill) に対して AWS lambda で処理を定義出来ます。

実際に、弊社のシアトルオフィスの社員が skill 開発体験をブログにまとめておりますので、合わせてご参照ください。

AWS Lambdaを使ってAmazon Echoに機能追加してみた

作成した Skill は Amazon の審査を経て、サードパーティーアプリ(Alexa Companion App)として Alexa ポータルに公開されます。

他国・多言語展開について

次のドイツとイギリスで展開する予定だが、ローンチの具体的なスケジュールは決まっていない。

自作スキルをプロモーションしてくれる仕組みは?

Alexaコンパニオン Appが該当し次のURLから確認できます。 http://alexa.amazon.com/#skills

音声の認識について

常に慣れている声出なければ対応しません。 生の音声でも録音音声でも同じように反応します。 家族で共有する場合も、家族ごとの音質の違いは識別せず、あくまで音声のテキスト変換結果を元に Alexa が処理します。

Alexaを組み込むロードマップ

1億ドル分の Alexa ファンドプログラムを用意しており、 Alexa をつかった有望なプロジェクトに対しては、予算を出すプログラムが存在します。

https://developer.amazon.com/public/solutions/alexa/alexa-fund

その他

プッシュ通知機能

Echo にプッシュ通知する仕組みは存在しません。 あくまでも、Echo への音声入力を元に動作します。

人気の 3rd パーティーアプリについて

イベントチケットを売買する StubHub 社が、直近のイベントを通知するアプリを提供しており、人気がある。

プライムサービス

プライムサービスを申し込まないと、大幅な機能制限があるので注意すること。

日本での利用について

Amazon Echo は技適を取得していないため、日本では Echo を利用することが出来ません。