【新機能】Amazon Rekognitionの画像からのテキスト検出が改良されました

はじめに

今日の新機能はこちら!

昨年11月に、Amazon Rekognitionのアップデートがあり、画像からのテキスト検出が可能になりました。その時に以下のブログを書いています。

ただし、この際には「検出対象のテキストは、水平軸のプラスマイナス30度の範囲内である必要がある」という仕様の制限がありました。今回のアップデートにより、水平軸のプラスマイナス90度の範囲まで対応可能になりました。かなり傾いていても検出することが出来ます。

ということでやってみました!

やってみた

まずは水平。もちろん問題ありません。

プラス30度。

プラス60度。以前の制限だった30度を超えました!

プラス90度。ちゃんと認識していますね。

プラス120度。あれ、認識してます!すごい!

プラス150度。流石に逆さまは厳しいらしく、認識できませんでした。

ではマイナスも確認します。マイナス60度。難なく認識します。

マイナス120度も認識します!

マイナス150度。プラスと同様、150度は厳しいようです。

さいごに

仕様として謳われている水平軸のプラスマイナス90度以上の認識をすることが出来ました。今回は背景なしの文字列だったので認識率が高かったのですが、写真に含まれている文字であれば認識精度は下がると思います。以下のように、写真でもちゃんとプラスマイナス90度で認識できます。

水平軸のプラスマイナス90度まで認識できるのであれば、利用の幅はかなり広がるのではないでしょうか。