ちょっと話題の記事

Amazon Echoを持っていなくてもAmazon Alexaの音声認識技術を試す方法

2016.06.09

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、せーのです。先日、AWS Summit Tokyoも盛況のうち無事終わり、だいぶ日常業務に戻ってきた感があります。
今日は音声認識の話題です。

タッチの次はボイス

AWS SummitではDevOps、IoT、サーバレスアーキテクチャあたりの話題が盛況でしたが、"次の波"として注目されていたのが音声認識技術についての話題でした。

alexaexeptecho1

Amazonでは既に「Amazon Echo」という音声認識によるアシスタントデバイスが売りだされ、アメリカで大人気となっています。他にもIBMの「Watson」やAppleの「Siri」、Googleの「Google now」やMicrosoftの「Cortana」等、キーボードからタッチに移り始めたデバイス入力方法の次は声による入力、という見方が大勢となっています。AWS Summit TokyoでもAmazonの自然言語応答サービスであるAVS(Alexa Voice Service)のエヴァンジェリストであるAmit氏がベーシックなAlexaの仕組みを語っていました。

[レポート] クラウドとマイクロサービスによる音声操作の新時代 - Amazon Echo & Alexa #AWSSummit

Alexaはサードパーティや開発者に機能(スキル)のデプロイを開放していて、今年1月に130強だったスキルの数は現在1000を超えています。もちろん日本でもスキルの開発、公開は可能です。

立ちはだかる技適の壁

しかし一つ大きな問題があります。日本ではAmazon Echoが売っていない、という点です。Amazon Echoはアメリカ市場のみを現状ターゲットにしていて、サードパーティスキルもドミノ・ピザやKayak,Uber等アメリカで使うものばかりです。なにより日本で売っていないのでAmazon EchoやAmazon Tap, Echo dotは日本の技適を通っていません。日本でスキルを作ることはできても、日本でそれを確かめることができません。どうしたら良いのでしょうか。

実はAmazon Echoがなくてもスキルをテストする方法はいくつかありますのでご紹介します。

Echosim.io

まずはブラウザです。Echosim.ioというAlexa用のシミュレーションサイトがあるのです。

simuratealexa0

使い方も簡単です。まずはAmazonアカウントでログインします。OAuthの許可を促されるのでOKを押します。

simuratealexa1

後はマイクボタンをクリックしながらマイクで話しかければ答えてくれます。例えば"What's the weather in Tokyo, Japan?"と聞けば東京の天気を教えてくれますし、"Hello"や"Good morning"と言えばいい感じに答えてくれます。最近の簡単なスキルでは"Who you gonna call?"と聞くと、、、これがわかる方は結構な年代ですね。

Lexi

次はモバイルです。Alexaには元々"Alexa App"という専用のモバイルアプリが用意されているのですが、日本のApp Storeでは表示されません。そこでテスト用のアプリを使ってみましょう(有料です)。"Lexi"と言います。

simuratealexa3

使い方はEchosimと同じくAmazonアカウントでログインしたらタップしながら話しかければOKです。

simuratealexa4

ただここでカスタムアプリの製作者には一点注意点があります。既にiPhoneの中に"Amazonアプリ"が入っているとLexiはAmazonアプリを使用してOAuthしにいきます。日本でAmazonアプリを落としていればそのアカウントはAmazon.co.jpになるので、自然とLexiのOAuth先もAmazon.co.jpとなり、カスタムスキルを試すことができなくなります。その際はAmazonアプリを削除するとブラウザを通じてAmazon.comに認証にいきます。

AVS

simuratealexa6

最後は自作、という方法をご紹介します。Alexaにはカスタムスキルを作る"Alexa Skills Kit"というサービスの他にAVS(Amazon Voice Service)という自然応答サービスが公開されています。

simuratealexa5

Alexa Skills KitがAlexaの中にカスタムで"サービス"を作るものであることに対して、AVSはAlexaのAPIの手元のデバイスから操作するためのSDKです。こちらを使えばマイクとスピーカーさえつながっているデバイスであればなんでもAlexaが試すことができます。例えばJAWS-UGというAWSの日本ユーザーグループの神戸支部ではRaspberryPiにAVSを載せた"Alexa Pi"というのを公開しています。

https://github.com/jaws-ug-kobe/AlexaPi

またAmazonの公式からもRaspberry Pi + AVSのソースは公開されていますので、こちらもチェックしてみてください。ステップバイステップで作り方が載っています。本ブログでも後日詳しくご紹介します。

https://github.com/amzn/alexa-avs-raspberry-pi

まとめ

いかがでしたでしょうか。音声認識技術はこれからの技術です。日本でもAmazon Echoが発売されるように(そして日本語でも会話できるように)開発者の皆さんはスキルづくり、頑張りましょう!