produced by Classmethod ˗ˏˋ 技術とビジネスの祭典 ˎˊ˗ Classmethod ODYSSEY 事前登録受付中

ちょっと話題の記事

AVFoundation+OpenCVで矩形検出（「名刺撮影用カメラ」みたいなやつ作ってみました）

SIN

2017.02.28

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

1 はじめに

AVFoundationで、AVCaptureVideoDataOutputを出力に指定すると、毎秒30フレームほどの画像が取得できます。この画像から矩形を検出し、元の長方形に整形する「名刺撮影用のカメラ」みたいなものを作ってみました。

人が、画像から名刺の位置を識別するのは簡単ですが、プログラムでやるとなると、やはり少し色々な工夫が必要でした。

本記事では、その辺を紹介させて頂きたいと思います。なお、AVFounndationや、OpenCVの使用方法については、以前の記事と重複するため、詳しくはそちらをご参照下さい。

[iOS] AVFundationを使用して、「ビデオ録画」や「連写カメラ」や「QRコードリーダー」や「バーコードリーダー」を作ってみた
 [iOS] AVFoundation+OpenCVで劇画調カメラを作ってみた

2 ２値化

OpenCVでは、findContoursというメソッドで画像の中で輪郭検出が可能です。このメソッドの入力は、２値画像が対象となっています。そこで、まずは、最初に２値化を行います。

(1) グレースケール

画像の色空間を変換するcvtColorに、CV_BGR2GRAYを指定することで、グレースケールに変換できます。

cv::Mat gray; // グレースケール出力用
cv::cvtColor(mat,gray,CV_BGR2GRAY);

006 001

この状態でも、findContoursを使用することは可能ですが、境界が不鮮明のため輪郭検出は誤差が多すぎます。そこで、thresholdを使用して閾値処理を行います。

cv::threshold(gray, gray, 0, 255, CV_THRESH_BINARY | CV_THRESH_OTSU);

002

明るい場所や、机の色が明るい場合、机の光った部分などの影響で輪郭検出に支障が出ることがあります。そのような場合は、CV_THRESH_TOZERO_INVで、いったん閾値よりも上を飛ばしてしまい、白黒反転してからfindContoursで処理すると良いかもしれません。

cv::threshold(gray, gray, 200, 255, CV_THRESH_TOZERO_INV );
cv::bitwise_not(gray, gray); // 白黒の反転
cv::threshold(gray, gray, 0, 255, CV_THRESH_BINARY | CV_THRESH_OTSU);

003 004 005

3 輪郭検出

２値化が完了したので、いよいよfindContoursを使用します。下記のコードは、検出した輪郭を赤色で表示したものです。

std::vector<std::vector<cv::Point>> contours;
std::vector<cv::Vec4i> hierarchy;
cv::findContours(gray, contours, hierarchy, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_TC89_L1);

int max_level = 0;
for(int i = 0; i < contours.size(); i++){
    cv::drawContours(mat, contours, i, cv::Scalar(255, 0, 0, 255), 3, CV_AA, hierarchy, max_level);
}

007

ここまででも、一応、名刺の輪郭が取れていますが、まだ千個以上のエリアの集合なので、後の処理に無理があります。そこで、contourAreaを使用して、検出した各エリアの面積を求め、ある程度以下のもの排除し、approxPolyDPで輪郭を直線近似化します。最後に、頂点が４つのものだけを選出すると、矩形が検出できたことになります。

int max_level = 0;
for(int i = 0; i < contours.size(); i++) {
    // ある程度の面積が有るものだけに絞る
    double a = contourArea(contours[i],false);
    if(a > 15000) {
        //輪郭を直線近似する
        std::vector<cv::Point> approx;
        cv::approxPolyDP(cv::Mat(contours[i]), approx, 0.01 * cv::arcLength(contours[i], true), true);
        // 矩形のみ取得
        if (approx.size() == 4) {
            cv::drawContours(mat, tmpContours, i, cv::Scalar(255, 0, 0, 255), 3, CV_AA, hierarchy, max_level);
        }
    }
}

下記は、２つの矩形が検出できているようすです。

008

4 透視変換

カメラの画像は、真上から正確に撮らない限り、長方形にはなりません、そこで、warpPerspectiveを使用して画像の透視変換を行いました。

009

変換元は、先の輪郭検出で取得した矩形の頂点です。そして、変換先は、その外接矩形の頂点です。とりあえず、歪みだけをOpenCVのwarpPerspectiveで修正し、縦横の比率については、予め名刺の比率に合わたUIImageにScale To Fillで表示することで合わせました(すいません、実は、ちょっと適当)。

cv::Point2f src[4]; // 変換元　
cv::Point2f dst[4]; // 変換先
cv::Mat perspective_matrix = cv::getPerspectiveTransform(src, dst);
cv::warpPerspective(mat, mat, perspective_matrix, mat.size(), cv::INTER_LINEAR);

5 最後に

今回は、OpenCVを使用させて頂いて、矩形の検出をしてみました。

OpenCVの画像処理では、直線の検出なども可能なので、この他にも色々なものを検出して面白いものが作れそうです。

6 参考リンク

とりあえずSquare
OpenCV関係
 opencv/squares.cpp at master · opencv/opencv · GitHub
画像処理 — OpenCV-CookBook
動的配列クラス std::vector の操作
 [iOS] AVFundationを使用して、「ビデオ録画」や「連写カメラ」や「QRコードリーダー」や「バーコードリーダー」を作ってみた
 [iOS] AVFoundation+OpenCVで劇画調カメラを作ってみた

AVFoundation+OpenCVで矩形検出（「名刺撮影用カメラ」みたいなやつ作ってみました）

1 はじめに

2 ２値化

(1) グレースケール

3 輪郭検出

4 透視変換

5 最後に

6 参考リンク

イベント

EVENT【5/29（水）大阪】Alteryxの使い方から導入メリットまですべてがわかるセミナー＆ワークショップ

EVENT【5/15（水）リモート】クラスメソッドの会社説明会を開催します

EVENT【5/8リモート】クラスメソッドのフリーランスエンジニア会社説明会〜フィンテック / リテール業界案件特集〜を開催します

EVENT【5/28（火）】AWSを最大活用するための1dayカンファレンス

EVENT【5/17（金）】認証機能の開発工数削減をデモで体験！次世代認証基盤サービス『Auth0 by Okta』導入実践ウェビナー

EVENT【5/14（火）】アノテーションの中途向けオンライン会社説明会を開催します

EVENT【5/23（木）】ユースケースに学ぶAWS運用のノウハウ～可視化から統制まで～

EVENT【5/16（木）】Snowflakeを触ってみよう！初めての方向けハンズオンセミナー

EVENT【5/10（金）名古屋】クラスメソッドグループの会社説明会を開催します！

EVENT【4/25（木）リモート】Google Cloudに携わるエンジニアのキャリア～クラスメソッド会社説明会～

AVFoundation+OpenCVで矩形検出（「名刺撮影用カメラ」みたいなやつ作ってみました）

1 はじめに

2 ２値化

(1) グレースケール

3 輪郭検出

4 透視変換

5 最後に

6 参考リンク

イベント

EVENT【5/29（水）大阪】Alteryxの使い方から導入メリットまですべてがわかるセミナー＆ワークショップ

EVENT【5/15（水）リモート】クラスメソッドの会社説明会を開催します

EVENT【5/8リモート】クラスメソッドのフリーランスエンジニア会社説明会 〜フィンテック / リテール 業界案件特集〜 を開催します

EVENT【5/28（火）】AWSを最大活用するための1dayカンファレンス

EVENT【5/17（金）】認証機能の開発工数削減をデモで体験！次世代認証基盤サービス『Auth0 by Okta』導入実践ウェビナー

EVENT【5/14（火）】アノテーションの中途向けオンライン会社説明会を開催します

EVENT【5/23（木）】ユースケースに学ぶAWS運用のノウハウ～可視化から統制まで～

EVENT【5/16（木）】Snowflakeを触ってみよう！初めての方向けハンズオンセミナー

EVENT【5/10（金） 名古屋】クラスメソッドグループの会社説明会を開催します！

EVENT【4/25（木）リモート】Google Cloudに携わるエンジニアのキャリア～クラスメソッド会社説明会～

関連記事

Matterport × iPhone 12 Pro による LiDAR Scan で、クラスメソッド日比谷オフィスの 3D モデルを生成してみた

[小ネタ] ラスベガスに到着してからiPhoneのカメラのシャッター音が消えた件 #AWSreInvent

[iPhone] 歴代iPhone早見表(2023後期現在版)を更新しました

iPhone12からiPhone15Proに機種変更した際の覚書はパスキー快適の一言で占められていた

EVENT【5/8リモート】クラスメソッドのフリーランスエンジニア会社説明会〜フィンテック / リテール業界案件特集〜を開催します

EVENT【5/10（金）名古屋】クラスメソッドグループの会社説明会を開催します！