【レポート】今日から始めるAlexaデバイスのプロトタイプ開発 #alexaday2018 #jawsug

2018.02.11

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

ご機嫌いかがでしょうか、豊崎です。

本日行われているはAlexa Day 2018に来ております。

弊社市田のセッションを拝聴いたしましたので、レポートしたいと思います。

Alexa Dayとは

Alexa Day 2018は、米国をはじめとして世界中で爆発的な人気となっており、今後国内のAI技術に対して大きなインパクトを与えることが予想されるAIアシスタントの「Alexa」やこれを支えるServerlessアーキテクチャ・LEX・AIやMLなどの技術や最新情報の共有を目的として、AWSの日本のユーザーグループ「JAWS-UG」メンバーを中心とした有志のボランティアにより企画・開催されるものです。

当日はビギナーからハイエンドなエンジニア、ビジネス層の方、ファミリーまで楽しくカジュアルに参加できる企画を実施する予定です。

以下URLから引用 https://alexaday2018.jaws-ug.jp/

スピーカー

市田 善久

セッション概要

 

今日から始めるAlexaデバイスのプロトタイプ開発

レポート

アジェンダ

  • これまでの音声対話の歩み
  • Alexaとは?
  • Alexaの仕組みとハードウェアアーキテクチャ
  • インタラクションモデルとオーディオフロントエンド
  • Amazon AVS開発キットの紹介と使い方、その性能

これまでの音声対話の歩み

音声の対話の大きな流れは以下のようになっている

  • 単一のマイク
  • 対話は一方向
  • 常時起動(電源On状態)

  • プッシュトーク
  • 内蔵スピーカー
    • 例)トランシーバーなど

  • 音声起動
  • ノイズキャンセル
    • 例)ヘッドセットなど

  • 360度マイクカバレッジ
  • 検出範囲の拡大
    • ニアフィールトからファーフィールドへ

Alexaとは?

Amazon Echoの登場!

国内ではgoogle home、clovaなどと共に、音声で操作できるデバイスとして認知度が向上している。

CESにおける存在感

CES=アメリカで開催される、世界最大のIT・家電の見本市

CESにおけるAlexaのインパクト

  • CES2017ではAlexaとのコラボ商品が爆発的に増加
  • 多くはAlexaを利用しており、AppleやGoogleの利用は一部のメーカーにとどまった。

Alでできること

  • 音楽再生
  • ピザの注文
  • スマートホーム
  • タクシーの配車リクエスト
  • ビジネスへの利用
  • などなど

豆知識

Alexaは関西弁もしゃべることができるよ!

Alexa対応製品の紹介

  • echo Series
  • echo look
  • echoshow
  • Fire TV
  • ecobee4
  • Roav VIVA
  • Smart Speaker P3
  • Eufy Genie

Alexaの仕組み

Alexaの音声対話の仕組みを概要から詳細へと段階的な紹介がされました。

シンプルなイメージ

少しフォーカスしたイメージ図

ハードウェアアーキテクチャ

インタラクションモデルとオーディオフロントエンド

3つのインタラクションモデル

  • タッチ操作
  • ハンズフリー
  • ファーフィールド(遠隔ソリューション)

適切なオーディオフロントエンド

  • オーティオアルゴリズム
  • マイクの配置
  • マイクの数

3つを適切に組み合わせる

オーティオアルゴリズム?

  • ノイズリダクションアルゴリズム
    • 音声や映像などの信号のノイズを抑制・軽減する信号処理
  • オートゲインコントール
  • オーディオ入力の処理方法
    • リニア処理:大きい音は大きく、小さい音は小さく聞こえる
    • ノンリニア処理:小さい音も大きい音も同じ程度の音量で聞こえる

S/N比=聞きたい声/周りの騒音

Alexaデバイスを開発する上でオーディオ入力はリニア処理を使用するべき。 音声認識精度に影響が出るためです。

アコースティックエコーキャンセル

デバイス自身が発したスピーカーからの音声や音楽が内蔵のマイクによって拾われてしまう。 「本来認識してほしいユーザの発話」と、上記に書いたような「エコー(やまびこのように拾った音)」をエコー側に発生する遅延によって判断してDSPでエコーを除去する。

ビームフォーミング

複数のマイクを利用して、各マイクへの音声到達時間の差を利用して、音源の角度を計算する Alexaは認識した方向に青いランプが光る 15度以内からの角度がもっともよく認識できる

Amazon AVS 開発キット

Amazon AVS開発キットとは?

  • Alexa搭載製品を作成するためのリファレンスソリューション
  • チップセットや音声処理技術、AVS API を活用したクライアントソフトウェア

様々なAVS開発キットの紹介がされていました

>テキストにおこすのがスライド公開に期待w

デバイスキットについて

  • 作るのは比較的容易
  • 日本語対応は今の所ないかも。。
  • 半田付け不要

rpi-updateには注意が必要

  • 最新のカーネル/ファームウェアにアップデートされるが正常な動作の保障がされていない為、要注意!

感想

Alexaの仕組みから始まり、開発キットの紹介、さいごにはデモ動画までありました。 個人的には、ハードウェアアーキテクチャと、アコースティックエコーキャンセルの説明が非常に面白かったです。