この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。
はじめに
清水です。re:Invent2016 Day1 Keynoteにて画像分析を行える新サービス Amazon Rekognition が発表されました。
深層学習(Deep Learning)による画像検出と認識が行えるサービスです。
何ができるサービスか?
深層学習による画像検出と認識ということですが、具体的にどんなことができるのでしょうか?公式ペー ジに掲載されていた例を元にまとめてみます。
- Object and scene detection(画像に写っている物と状況の分析)
- 画像ファイルを入力として、その入力画像には、人物、岩、森、マウンテンバイク、アウトドアなどが、 含まれている、という分析結果が得られます。分析結果はラベル(人物、岩、など)とそれぞれの精度(90%)の情報から構成されます。
- Facial analysis(表情分析)
- こちらも画像ファイルを入力として、入力画像の人の顔について、Eyes are open(瞳が開いている)、Happy(幸せそう)、Smiling(笑っている)などのラベルと、その精度情報が分析結果として得られます。
- Face comparison(顔の類似度比較)
- 2つの画像ファイル、または画像ファイルと以前に認識した顔の情報(顔ベクトル)を入力として、同じ人かを類似度(Similarity)の数値で分析できます。
やってみた
RekognitionはSDKを使いアプリケーションなどと連携して使用されることが想定されていますが、Management Consoleにはデモ機能があり、手軽にどんな結果が得られるかの確認ができます。 さっそくこちらを使ってみました。なおRekognitionは現在、US East (Northern Virginia)、US West (Oregon)、Europe (Ireland)のリージョンでのみ使用可能とのことです。今回はUS East (Northern Virginia)で試してみました。
Management Consoleを開いてみると、Try DemoのボタンとDownload SDKsのリンクがあります。 Try Demoをクリックしてデモ画面へ進みます。
Object and scene detectionのデモ画面が表示され、Sample画像の分析結果が得られます。スケボー、スポーツ、などの状況が適切に分析されていることがわかります。
続いて、分析したい画像をアップロードしてみます。 画面中央下部のUploadボタンをクリックして、ダイアログから分析したい画像を選択します。
今回は先日のAWSコンサルティング部合宿にて卓球をしている弊社メンバーの写真を入力画像として使用してみました。アップロードが終了すると、すぐに分析結果が得られました。
分析結果として、People, Person, Humanなどの他、 きちんとPing Pongつまり卓球を行っていることが分析されていました!すごい。
また、分析結果についてはManagement Console上でResponseというかたちでJSON形式のデータが確認できました。精度50%以上のものが列挙されているようです。きちんと「Blackboard(黒板)」のラベルも付与されていますね。
{
"Labels": [
{
"Confidence": 98.57548522949219,
"Name": "People"
},
{
"Confidence": 98.57552337646484,
"Name": "Person"
},
{
"Confidence": 98.47394561767578,
"Name": "Human"
},
{
"Confidence": 75.91724395751953,
"Name": "Cafeteria"
},
{
"Confidence": 75.91724395751953,
"Name": "Restaurant"
},
{
"Confidence": 67.54232025146484,
"Name": "Ping Pong"
},
{
"Confidence": 67.54232025146484,
"Name": "Sport"
},
{
"Confidence": 64.42754364013672,
"Name": "Classroom"
},
{
"Confidence": 62.74812316894531,
"Name": "Cafe"
},
{
"Confidence": 62.74812316894531,
"Name": "Food Court"
},
{
"Confidence": 60.79604721069336,
"Name": "Blackboard"
},
{
"Confidence": 59.31776809692383,
"Name": "Apartment"
},
{
"Confidence": 59.31776809692383,
"Name": "Housing"
},
{
"Confidence": 59.31776809692383,
"Name": "Indoors"
},
{
"Confidence": 59.31776809692383,
"Name": "Room"
},
{
"Confidence": 54.8029670715332,
"Name": "Home Decor"
},
{
"Confidence": 54.8029670715332,
"Name": "Linen"
},
{
"Confidence": 54.8029670715332,
"Name": "Tablecloth"
},
{
"Confidence": 52.919273376464844,
"Name": "Interior Design"
},
{
"Confidence": 51.997554779052734,
"Name": "Dining Room"
},
{
"Confidence": 50.84735870361328,
"Name": "Apparel"
},
{
"Confidence": 50.84735870361328,
"Name": "Clothing"
},
{
"Confidence": 50.61591339111328,
"Name": "Chair"
},
{
"Confidence": 50.61591339111328,
"Name": "Furniture"
}
]
}
おわりに
re:Invent2016 Day1 Keynoteにて発表された深層学習による画像分析サービス Amazon Rekognition についてお伝えしました。デモ機能を使ってみた感触としては、こんなに簡単に高度な画像分析ができるのか!というものです。アプリケーションとの連携で色々なサービスへの発展ができるのではないかと思います。
今回さわってみたObject and scene detectioの他にもFacial analysisやFace comparisonのデモ機能、そして肝心のSDKとの連携についても、追ってまとめてみたいと思います。