re:Growth2016 TokyoでAmazon AIの話をしてきた #reinvent #cmdevio

2016.12.07

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、せーのです。先日半蔵門にあるSAPさんにて弊社イベント「CM re:Growth 2016 Tokyo」に登壇してきました。

スライド

こちらがスライドになります。

※スライドだけを見てもよくわからん、という方は次回は是非現地へ来て頂けますようよろしくお願い致します。 「なんか随分少なくなってね?」大人とはそういうものです。

補足

Convolutional Neural Network(CNN)について

Deep Learningの例として画像認識でのDeep Learningのプロセスを軽く解説致しました。こちらのプロセスは画像認識としては代表的な手法である「Convolutional Neural Network(CNN)」という方式になります。

rekognition_1

左側の犬の周りに青い四角と矢印が見えるでしょうか。これがCNNの特徴となります。

通常は1ピクセルごとに認識を行うのですが、そうするとちょっとした歪みやにじみによって認識結果が大きく左右されてしまいます。そこである程度大まかな枠を取り、それをスライドさせていって受けた結果を圧縮します。そうすることで「ここのドットの色は白かクロか」という判断ではなく「右上から左下に向かって境界線が伸びていて途中で曲がって右下に帰結するような形」 => 犬の耳っぽい、という判断をしていくことになるわけです。これを畳み込み(Convolution)と言います。

こうやって単純な形状から認識していき、レイヤーの種類を増やすことでどんどん複雑な形状に適応していったものをFully Connected layerという最後のレイヤーで接続して一つのオブジェクトを生成します。

出力される選択肢は通常レイヤーの数だけ出てきます。理論的にはある選択肢のみ1、他が0で出てくるはず(例えば上記画像の犬種であればラボラドールが1、他のチワワやプードルは0になる)なのですが現実はそんなに簡単にはなりません。そこでSoftmax関数を使って出力結果を確率に変換して最も大きい数を「結論」として出力します(ラボラドールである確率が97%、みたいな)。

Lexと相性がいいのはMobile Hub

未来の可能性を感じさせるBotサービスであるLexですが、実用として多いパターンはECサイト等の既存のWebサービス、アプリにBotによるインタラクションを組み込む、というパターンになるのではないかと推測されます。また音声によるコミュニケーションということでマイクが内蔵されているモバイルサービスがユースケースとして多用されることかと思います。

またAWSのモバイル開発サービスであるMobile HubとLexは非常に相性がよく、iOSやAndroidアプリにLexによるBotを入れたい、とお考えの方はMobile Hubを使ってサービスを作るとlexの開発が簡単になることでしょう。

まとめ

ということで雑貨紹介あり、内輪受けありとre:Growthらしいお祭り感満載のセッションをおとどけしました。東京は10分という短い枠でしたがこのあと開催される「re:Growth2016 Sapporo」ではもう少し長い枠をいただいているのでもう少しゆっくりお話出来るかと思います(デモももひとつくらいふやせるかも)。皆様是非今度は12/14, 札幌にてお会いしましょう。