AWS re:Invent Tour – Seattle Session 「Amazon Echo & Alexa」レポート #reinvent
re:Inventの特別コースとしてAmazon本社のあるシアトルに来ております。
社屋の一つである「Blackfoot」で「AWS re:Invent Tour - Seattle Session」という特別セッションが開催されました。
10:00 - 10:30 に行われた「Amazon Echo & Alexa【通訳セッション】」についてレ ポートします。
各セッションレポートにつきましては、以下をご覧ください。
- AWS re:Invent Tour – Seattle Session 「Welcome & Opening」
- AWS re:Invent Tour – Seattle Session 「Amazon Instant Video(プライムビデオ)」
- AWS re:Invent Tour – Seattle Session 「Amazon Echo & Alexa」 (当記事)
- AWS re:Invent Tour – Seattle Session 「Support Updates & Amazon Culture」
スピーカー
Sonil Ahuja, Software Development Engineer, Alexa Team
Echo & Alexa
Echoとは、iPhone の Siri のように音声で命令できるデバイス。 Amazonでの購買、音楽再生などが最初から組み込まれています。 Alexa Skills Kitを使うとユーザー自身が音声コマンドを拡張できます。
音声技術には次の3つの重要なコンポーネントがあります。
- ASR(automatic speech recognition): echo の入力を元に音声をテキストに変換します。
- NLU(natural language understanding): 自然言語理解。意図を出す。Skillに渡される。
- TTS(text to speech): ASR とは逆に、処理結果のテキストを echo で再生するために音声に変換します。
Alexa Skills Kit の開発について
Alexa Skill kitは無料で利用出来、SDK が公開されています。 音声コマンド(skill) に対して AWS lambda で処理を定義出来ます。
実際に、弊社のシアトルオフィスの社員が skill 開発体験をブログにまとめておりますので、合わせてご参照ください。
AWS Lambdaを使ってAmazon Echoに機能追加してみた
作成した Skill は Amazon の審査を経て、サードパーティーアプリ(Alexa Companion App)として Alexa ポータルに公開されます。
他国・多言語展開について
次のドイツとイギリスで展開する予定だが、ローンチの具体的なスケジュールは決まっていない。
自作スキルをプロモーションしてくれる仕組みは?
Alexaコンパニオン Appが該当し次のURLから確認できます。 http://alexa.amazon.com/#skills
音声の認識について
常に慣れている声出なければ対応しません。 生の音声でも録音音声でも同じように反応します。 家族で共有する場合も、家族ごとの音質の違いは識別せず、あくまで音声のテキスト変換結果を元に Alexa が処理します。
Alexaを組み込むロードマップ
1億ドル分の Alexa ファンドプログラムを用意しており、 Alexa をつかった有望なプロジェクトに対しては、予算を出すプログラムが存在します。
https://developer.amazon.com/public/solutions/alexa/alexa-fund
その他
プッシュ通知機能
Echo にプッシュ通知する仕組みは存在しません。 あくまでも、Echo への音声入力を元に動作します。
人気の 3rd パーティーアプリについて
イベントチケットを売買する StubHub 社が、直近のイベントを通知するアプリを提供しており、人気がある。
プライムサービス
プライムサービスを申し込まないと、大幅な機能制限があるので注意すること。
日本での利用について
Amazon Echo は技適を取得していないため、日本では Echo を利用することが出来ません。