【新機能】Amazon Rekognitionで画像からのテキスト検出が出来るようになりました

2017.11.28

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

先日以下のアップデートアナウンスがありました。

Amazon Rekognitionで3つのアップデートがありました。

今日はそのうち、画像からのテキスト検出をご紹介します。公式ドキュメントは以下。

Amazon Rekognition管理コンソールを表示すると、以下のように[Text in image]というリンクが追加されています。

[アップロード]ボタンをクリックして、画像ファイルをアップロードします。ファイルサイズは最大5MBまでです。以下のようにちゃんとテキストを検出してくれました！

テキスト検出は以下の仕様があります。

つまり日本語は検出できません。以下の例では、「進入禁止」は検出できませんが「DO NOT ENTER」は検出出来ています。

水平軸に90度の文字列も検出できません。

テキスト検出によって、大量の画像から同じテキストが含まれた画像を検出できます。ユースケースとしては、例えばソーシャルメディアの写真を検索して、イベント名が含まれた画像を抽出する、などは面白そうだなと思います。

さて、現在開催されているAWS re:Invent 2017では、Rekognitionにもアップデートがあるのではないかな、と思っています。どのようなアップデートが発表されるのか楽しみです！