【新機能】Amazon Rekognitionで画像からのテキスト検出が出来るようになりました

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

先日以下のアップデートアナウンスがありました。

Amazon Rekognitionで3つのアップデートがありました。

  • 画像からのテキスト検出
  • リアルタイム顔検出
  • 顔検出の10%の精度向上

今日はそのうち、画像からのテキスト検出をご紹介します。公式ドキュメントは以下。

やってみた

Amazon Rekognition管理コンソールを表示すると、以下のように[Text in image]というリンクが追加されています。

[アップロード]ボタンをクリックして、画像ファイルをアップロードします。ファイルサイズは最大5MBまでです。以下のようにちゃんとテキストを検出してくれました!

テキスト検出は以下の仕様があります。

  • 検出対象のテキストは、水平軸のプラスマイナス30度の範囲内である必要がある。
  • スペースで区切られていない1つ以上のISO basic latin文字をテキストとして検出する。
  • 画像内で最大50語を検出可能。
  • @、/、$、%、 - 、_、+、*、#などの数字及び記号も検出可能。

つまり日本語は検出できません。以下の例では、「進入禁止」は検出できませんが「DO NOT ENTER」は検出出来ています。

水平軸に90度の文字列も検出できません。

さいごに

テキスト検出によって、大量の画像から同じテキストが含まれた画像を検出できます。ユースケースとしては、例えばソーシャルメディアの写真を検索して、イベント名が含まれた画像を抽出する、などは面白そうだなと思います。

さて、現在開催されているAWS re:Invent 2017では、Rekognitionにもアップデートがあるのではないかな、と思っています。どのようなアップデートが発表されるのか楽しみです!