StepFunctionsを使って画像内ラベル検出をしてみる

もきゅりん

2019.06.24

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

おはようございます、もきゅりんです。

ふとしたタイミングでStepFunctionsを触る機会があったので、巷でよくあるパターンと言われている構成をやってみました。

下図です。

architecture image

例えば、こんな写真をアップロードしてみると、

crown cat

DynamoDBにこんな感じの結果が挿入されるというシロモノです。

cat result

AWSってすげー。。何か自分、無能かつ無為に生きててゴメンって思わされました。

とりあえずStepFunctions(も)楽しいです。

やってみよう

前提条件

AWS CLIがインストールされていること(手動で作成でも可)
StepFunctionsへの興味関心

S3バケットとDynamoDBテーブルをCFnで作成します。

※ 注すべてのリソースは同じAWSリージョン内に作成する必要があります。

やること

S3Bucket,DynamoDBを作成
Lambdaを準備
ステートマシン作成
S3イベント発生時にステートマシンを実行させる
テスト

1. S3Bucket, DynamoDBを作成

CFnで作成しちゃいます。

(コンソールから作成でも構いません。)

aws cloudformation deploy --template-file S3BucketDynamoDB.yml \
--stack-name demo-stepfunctions-resources

# S3BucketDynamoDB.yml

AWSTemplateFormatVersion: "2010-09-09"
Description: "Create DynamoDB Table & S3 Bucket"
Resources:
  DynamoTable:
    Type: "AWS::DynamoDB::Table"
    Properties:
      AttributeDefinitions:
        - AttributeName: "id"
          AttributeType: "S"
      KeySchema:
        - AttributeName: "id"
          KeyType: "HASH"
      ProvisionedThroughput:
        ReadCapacityUnits: "5"
        WriteCapacityUnits: "5"
      TableName: "ImageInfo"
  S3Backet:
    Type: AWS::S3::Bucket
    Properties:
      PublicAccessBlockConfiguration:
        BlockPublicAcls: true
        BlockPublicPolicy: true
        IgnorePublicAcls: true
        RestrictPublicBuckets: true

2. Lambdaを準備

やり方は他にも色々とあると思いますが、この稿では3つのLambdaを用意します。

S3のメタデータを取得するLambda
画像のラベル抽出をするLambda
DynamoDBにPutするLambda

(例えば、ステートマシンから直接DynamoDBテーブルにPutすることもできます)

本来はそれぞれに必要最小限の権限のロールを設定するのが定石なのですが、本番利用ではないという言い訳をしながら、下記のようなポリシーをlambda-basic-exec-roleに追加しています。

AmazonS3ReadOnlyAccess
AmazonDynamoDBFullAccess
AmazonRekognitionReadOnlyAccess
TranslateReadOnly

Translateについては、画像のラベル検出結果が英語のため、ナンダコレ？となるのを避けるために日本語翻訳させるためです。

下記3つのLambdaをPython3.7で、一から作成します。

ロールは上記、無精なlambda-basic-exec-roleです。

S3からはイベント発生時間、画像のバイト数、クライアントIPアドレス、ファイル名を取得しています。

ラベル検出は主要な結果と信頼性のみ取得しています。

# GetS3Metadata
def lambda_handler(event, context):
    id = event['id']
    time = event['time']
    size = event['detail']['additionalEventData']['bytesTransferredIn']
    IP = event['detail']['sourceIPAddress']
    file_name = event['detail']['requestParameters']['key']

    s3_meta_data = {}
    s3_meta_data['id'] = id
    s3_meta_data['size'] = str(size)
    s3_meta_data['time'] = time
    s3_meta_data['IP'] = IP
    s3_meta_data['file_name'] = file_name

    return s3_meta_data

# GetImageLabels
import boto3
import copy

rekognition_client = boto3.client('rekognition')
translate_client = boto3.client(service_name='translate', use_ssl=True)


def lambda_handler(event, context):

    fileName = event['detail']['requestParameters']['key']
    bucket = event['detail']['requestParameters']['bucketName']

    # 画像のラベル検出
    response = rekognition_client.detect_labels(
        Image={'S3Object': {'Bucket': bucket, 'Name': fileName}})

    detect_dict = {}

    temp_d = {}
    for i, label in enumerate(response['Labels']):
        # ラベルを日本語に翻訳
        labelName = translate_client.translate_text(Text=label['Name'],
                                                    SourceLanguageCode="en", TargetLanguageCode="ja").get('TranslatedText')
        temp_d['Label'] = labelName
        temp_d['Confidence'] = str(label['Confidence'])
        detect_dict[i] = str(copy.deepcopy(temp_d))

    return detect_dict

# PutDynamoDB
import boto3
import json
from datetime import datetime

dynamodb_resource = boto3.resource('dynamodb')
table = dynamodb_resource.Table('ImageInfo')


def lambda_handler(event, context):

    id = event[0]['id']
    size = event[0]['size']
    IP = event[0]['IP']
    time = event[0]['time']
    file_name = event[0]['file_name']
    image_labeling = event[1]

    time_stamp = datetime.now().strftime("%Y%m%d%H%M%S")

    # テーブル挿入
    table_put_item_response = table.put_item(
        Item={
            'id': id,
            'size': size,
            'IP': IP,
            'time': time,
            'file_name': file_name,
            'create_time_stamp': time_stamp,
            'detection': image_labeling
        }
    )
    return table_put_item_response

3. ステートマシン作成

ようやくStepFunctionsのお出ましです。

ステートマシンを作成します。

ロールはAWSLambdaFullAccessで進めています。

作成内容はこの図の通りです。

sfn image

Resourceのarnについては、2で作成したLambdaをそれぞれ作成順に記入して下さい。

# DemoImageExtract.json
{
  "Comment": "Coordinate tasks for image analysis",
  "StartAt": "ImageAnalysis",
  "States": {
    "ImageAnalysis": {
      "Type": "Parallel",
      "Next": "PutDynamo",
      "Branches": [
        {
          "StartAt": "ImageExtractMetaData",
          "States": {
            "ImageExtractMetaData": {
              "Type": "Task",
              "Resource": "arn:aws:lambda:ap-northeast-1:xxxxxxxxxxx:function:GetS3Metadata",
              "OutputPath": "$",
              "End": true
            }
          }
        },
        {
          "StartAt": "ImageLabeling",
          "States": {
            "ImageLabeling": {
              "Type": "Task",
              "Resource": "arn:aws:lambda:ap-northeast-1:yyyyyyyyyyy:function:GetImageLabels",
              "OutputPath": "$",
              "End": true
            }
          }
        }
      ]
    },
      "PutDynamo": {
        "Type": "Task",
        "Resource": "arn:aws:lambda:ap-northeast-1:zzzzzzzzzzzzz:function:PutDynamo",
        "End": true
      }
    }
  }