[AWS Data Pipeline]S3上の任意のシェルを実行しジョブを連携させる

千葉淳

2017.03.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

コンニチハ、千葉です。

AWS Data Pipelineを使って任意のシェルを実行してみましたのでご紹介します。

AWS Data Pipelineはジョブスケジューラとして利用でき、失敗した時に実行する処理、成功した時に実行する処理を定義することができます。具体的にはバックアップ処理やETL処理をなどに利用されたりします。

今回は、Data Pipelineを使ってS3上に配置した任意のシェルを実行してみます。やりたいことは以下です。

20170330_datapipline-exec-shell-1

やってみた

作業サマリです

S3バケット作成と実行シェルの配置
パイプラインの作成
シェル1の定義
シェルを実行するEC2の定義
シェル2の定義
EC2削除の定義
通知設定

S3バケットの作成と実行シェルの配置

実行するシェルを配置するS3バケットを用意し、シェルを配置します。

20170330_datapipline-exec-shell-2

ダミーのシェルで以下を配しました。echoするだけです。

シェル1

#!/bin/bash

echo "My name is shell 1"

シェル2

#!/bin/bash

echo "My name is shell 2"

パイプラインの作成

パイプラインを作成します。マネージメントコンソールのData Pipelineの画面から「Create new pipline」をクリックします。

20170330_datapipline-exec-shell-3

パイプライン名、ジョブ実行開始時刻、パイプラインのログ保存について適宜設定します。

20170330_datapipline-exec-shell-4

ジョブの設定画面に移行するので、こちらから各ジョブを定義していきます。

20170330_datapipline-exec-shell-5

シェル1の定義

シェル１を実行するジョブを追加します。任意のシェルを実行する場合は「ShellCommandActivity」を選択します。

20170330_datapipline-exec-shell-6

「Add an optional field...」より、以下のオプションを追加します。※オプションの詳細はShellCommandActivityを参照

Runs On
Script Uri

20170330_datapipline-exec-shell-7

シェルを実行するEC2の定義

シェルを実行するためのEC2を定義します。TypeをEC2にします。起動するAMIやリージョン、インスタンスタイプを適宜設定します。※オプションの詳細はEc2Resourceを参照

20170330_datapipline-exec-shell-8

シェル2の定義

シェル１と同じく「Add」から「ShellCommandActivity」を追加します。シェル１との違いはオプションに「Depends On」を追加し、「シェル１」を指定する箇所です。これで、シェル１が実行されたあとにシェル２が実行される用意なります。

20170330_datapipline-exec-shell-9

EC2削除の定義

シェル２が終了したタイミングでEC2の削除を行います。が、特に削除に関する定義しなくてもパイプライン終了後はEC2が自動で削除されました

逆に「actionOnTaskFailure」や「terminateAfter」を指定することで削除しないような設定ができそうでした。

通知設定

通知は、シェル２が終了したタイミングで成功 or 失敗で通知を行います。以下のオプションを追加します。

On Success
ON Fail

20170330_datapipline-exec-shell-10

次に「Others」を選択すると指定したアクションを設定できます。SNSでメール通知するように設定します。SNSトピックは別途作っておく必要があります。

20170330_datapipline-exec-shell-11

最終的なフロー

最終的にはフローは以下のようになりました。

20170330_datapipline-exec-shell-14

実行ログを見てみる

マネージメントコンソールでの表示

各ジョブのステータスや標準出力等のログを確認することができます

20170330_datapipline-exec-shell-12

メール

設定した通りメールも受信しました

20170330_datapipline-exec-shell-13

最後に

Data Pipelineを使ったジョブスケジューラを試してみました。S3上に配置した任意のシェルを実行できるので汎用性が高く、柔軟なジョブ作成ができるかなと思います。定期実行するようなシンプルなジョブについてはこちらで対応できそうです。

参考

http://docs.aws.amazon.com/ja_jp/datapipeline/latest/DeveloperGuide/what-is-datapipeline.html

[AWS Data Pipeline]S3上の任意のシェルを実行しジョブを連携させる

やってみた

S3バケットの作成と実行シェルの配置

シェル1

シェル2

パイプラインの作成

シェル1の定義

シェルを実行するEC2の定義

シェル2の定義

EC2削除の定義

通知設定

最終的なフロー

実行ログを見てみる

マネージメントコンソールでの表示

メール

最後に

参考

関連記事

主なカテゴリ

AWSで探す

注目のテーマ

プロダクトやサービスで探す

特集やシリーズから探す

お問い合わせ

運営会社