【新機能】Amazon Rekognitionで画像からのテキスト検出が出来るようになりました
はじめに
先日以下のアップデートアナウンスがありました。
Amazon Rekognitionで3つのアップデートがありました。
- 画像からのテキスト検出
- リアルタイム顔検出
- 顔検出の10%の精度向上
今日はそのうち、画像からのテキスト検出をご紹介します。公式ドキュメントは以下。
やってみた
Amazon Rekognition管理コンソールを表示すると、以下のように[Text in image]というリンクが追加されています。
[アップロード]ボタンをクリックして、画像ファイルをアップロードします。ファイルサイズは最大5MBまでです。以下のようにちゃんとテキストを検出してくれました!
テキスト検出は以下の仕様があります。
- 検出対象のテキストは、水平軸のプラスマイナス30度の範囲内である必要がある。
- スペースで区切られていない1つ以上のISO basic latin文字をテキストとして検出する。
- 画像内で最大50語を検出可能。
- @、/、$、%、 - 、_、+、*、#などの数字及び記号も検出可能。
つまり日本語は検出できません。以下の例では、「進入禁止」は検出できませんが「DO NOT ENTER」は検出出来ています。
水平軸に90度の文字列も検出できません。
さいごに
テキスト検出によって、大量の画像から同じテキストが含まれた画像を検出できます。ユースケースとしては、例えばソーシャルメディアの写真を検索して、イベント名が含まれた画像を抽出する、などは面白そうだなと思います。
さて、現在開催されているAWS re:Invent 2017では、Rekognitionにもアップデートがあるのではないかな、と思っています。どのようなアップデートが発表されるのか楽しみです!