AWSが「メディア解析ソリューション」構成例を公開 〜メディアからメタデータ抽出する環境をサクッと構築可能〜

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

清水です。AWS Summit Tokyo 2018で盛り上がっている最中ですが、昨日2018/05/31付でAWSから「メディア解析ソリューション(Media Analysis Solution)」というものが紹介されています。

本エントリではこのメディア解析ソリューションについて速報してみたいと思います。

AWSのメディア解析ソリューション(Media Analysis Solution)

AWS Summit 2018のKeynoteやセッションのいくつかで「メディア解析」、つまり画像や動画、音声ファイルからメタデータを取り出し、活用していく、ということが紹介されています。これをAWSで実現しようとした場合、解析サービスとしてAmazon Rekognition、Amazon Transcribe、Amazon Comprehendなどの利用が検討できます。Amazon Rekognitionは画像また動画ファイルからシーンの分析や顔認識、表情の分析や有名人検出などが行えます。またAmazon Transcribeでは音声からの文字起こしが、Amazon Comprehendではテキストの自然言語処理が行なえるサービスです。

これらAWSの解析サービス利用を考えた場合、システム化のためにはAmazon S3を始めとした他AWSサービスとの連携が欠かせません。これら他サービスとの連携を含めた、メディア解析環境についてAWSのベストプラクティスからなる構成がAWS Answersとして公開されました。

構成の詳細資料とともにAWS CloudFormationテンプレートも提供されているので、すぐに環境を構築して利用することができます!以下はAWS Answersのページより引用の構成図ですが、こちらの環境がサクッと構築できるわけですね。

構成としては以下の具合かと読み取っています。

  • メディアの分析として
    • メディアファイルをAmazon S3にアップデート
    • Amazon S3アップデートをトリガにAWS Lambdaが発火、AWS Step Functionsと連携
    • AWS Step FunctionsがAmazon Rekognition、Amazon Transcribe、Amazon Comprehendを呼び出し、メディアファイルからメタデータを抽出
    • メタデータはAmazon Elasticsearchに格納される
  • メタデータの利用として
    • Amazon Cognitoによるユーザ認証
    • Amazon API GatewayとAWS LambdaによりAmazon Elasticsearchから結果を返す

また利用に際しての注意点としては、アップロードファイル容量が制限されていること、また利用するサービスが利用可能なAWSのリージョンで展開することが記載されています。現時点でのAWSのRegion Tableによると、東京リージョン(ap-northeast-1)ではAmaozn Transcribe、Amazon Comprehendが提供前となっていますので、バージニアやオハイオ、オレゴンなど別リージョンを使用しましょう。

まとめ

AWSよりリリースされた「メディア解析ソリューション(Media Analysis Solution)」について、速報としてお伝えしました。AWS Summit TokyoでAmaozn Rekognitionなどを使ったメディアの解析例は紹介されていたけど、実際どうやって実現したら良いんだろう、、? なんて場合には、こちらのAWSのソリューションを利用、カスタマイズしていくことを検討してはどうでしょうか。本エントリでは概要の紹介のみでしたが、今後は実際に使ってみてまとめてみたいと思います。