Amazon Rekognition Videoの結果をビジュアルに確認する

Amazon Rekognition Videoによる人物の追跡

Amazon Rekognition Videoは、ディープラーニングベースのビデオ認識サービスです。映像内で動いている人物を認識することができます。とても簡単に利用することができますが、映像を分析した出力結果がJSONファイルのため、見た目に分かりづらい部分があります。そこで、今回は、出力されたJSONと元映像を重ね合わせて、リアルタイムに人物を追跡している風に表現したいと思います。

Amazon Rekognition Videoで出力されたJSONの中身の一部は以下のようになっています。動画の開始からTimestampミリ秒後にBoundingBoxの位置に人物を見つけたという意味です。小数点になっているのは、画面内の割合を表していますので、実際の映像サイズと掛け合わせることで座標が取得できます。

    {
      "Person": {
        "BoundingBox": {
          "Height": 0.550000011920929,
          "Left": 0.3713541626930237,
          "Top": 0.2888889014720917,
          "Width": 0.08281250298023224
        },
        "Index": 1
      },
      "Timestamp": 2533
    },

イメージはこんな感じです

ソースコード

参考資料

AWS ドキュメント » Amazon Rekognition » 開発者ガイド » 人物の追跡