
DevOps Agentのデモシナリオをまとめてみた
こんにちは。たかやまです。
DevOps AgentがGAされてから、社内外から相談される機会が増えてきました。
その中で、DevOps Agentを評価するためのデモを試したいというケースを耳にすることがあります。
そこで今回は、DevOps Agentの評価に使えるテストシナリオを5つまとめてみました。
さきにまとめ
| テストシナリオ | 対象読者 | カバー範囲 |
|---|---|---|
| AWS DevOps Agent ドキュメント テスト環境 | DevOps Agent をまずは試してみたい方 | EC2 CPU負荷, Lambdaエラーの単一系シナリオ |
| Network Incident Response | ベーシックなネットワークで試したい方 | ネットワーク障害4シナリオ |
| ECS Workshop | ECS経験者 | 5マイクロサービス・10シナリオ |
| EKS Workshop | K8s経験者 | EKS Auto Mode・5シナリオ |
| AWS ワークショップ (執筆時点でAWS主催イベント限定) |
網羅的に試したい方 | Lambda / コンテナ(ECS・EKS)/ Splunk連携 / AI-ML の4モジュール |
AWS DevOps Agent ドキュメント
AWS公式UserGuide内で紹介されている、DevOps Agent検証用のテスト環境構築手順です。
CloudFormationテンプレートをコピペで流すだけで、EC2のCPU負荷テスト または Lambdaのエラーテスト が選べます。
EC2は2時間で自動停止する作りになっているので、放置しても大丈夫なようにしているところが地味にありがたいです。
ここで学べるのは、CloudWatchアラーム発火 → DevOps Agent Investigation起動 → 根本原因と推奨事項の出力 の流れです。
とにかく一度動かしてDevOps Agentの調査動作を把握するのに向いています。
DevOps Agentにまだ触ったことがなく、まずは最短ルートで動かしてみたい方におすすめです。
sample-automated-aws-devops-agent-network-incident-response
ネットワーク障害の自動インシデント対応をDevOps Agentで実装するサンプルです。
構成は以下のようになっています。

CloudWatchアラーム発火 → SNS → Webhook → DevOps Agent Investigation の流れで、メトリクス・ログ・API変更履歴を関連付けて根本原因と修復計画を出力するところまでを再現できます。
CloudFormationテンプレートでシミュレーション環境(VPC・ALB・EC2・RDS・NAT Gateway・VPC Endpoint・Transit Gateway)が一通り立ち上がるので、ネットワーク系の検証環境を一から作る手間が省けるのが嬉しいところです。
シナリオは4本でネットワーク運用でありそうな事象をカバーしています。
- SGルール削除によるDB接続喪失
- NAT Gatewayルート削除によるインターネット到達性喪失
- VPC Endpointポリシー制限によるS3アクセス拒否
- Interface Endpointのサブネット削除によるBedrockタイムアウト
- マルチアカウントTransit Gatewayの誤関連付け(複雑シナリオ)
VPC / セキュリティグループ / ルートテーブルのベーシックなネットワーク運用のなかでDevOps Agentによる自動調査がどこまで使えるかを試したい方におすすめです。
sample-devops-agent-ecs-workshop
ECS Fargate環境でDevOps Agentのトラブルシュートを学ぶワークショップです。
retail-store-sample-app を題材にした5つのマイクロサービスをTerraformでデプロイし、DevOps Agentでトラブルシュートを行う内容になっています。
構成は以下のようになっています。

シナリオは10種類用意されていて、上記構成系6本と下記パフォーマンス系4本で構成されています。
- ログ未配信
- シークレット取得失敗
- ヘルスチェック失敗
- SG接続ブロック
- メモリ超過
- Service Connect切断
- CPU負荷
- DDoS
- DynamoDB攻撃
- オートスケーリング無効
RDS Aurora、DynamoDB、ElastiCache、Amazon MQまで含んだコンテナ運用環境の本番に近い構成でDevOps Agentの調査を試せます。
sample-devops-agent-eks-workshop
EKS Auto Mode上でDevOps Agentのトラブルシュートを学ぶワークショップです。
構成は以下のようになっています。

こちらもECSのWorkshopと同様に retail-store-sample-app を題材にしたマイクロサービス構成で、CapabilitiesでEKSアクセスを使ってDevOps Agentのトラブルシュートを行う内容になっています。
シナリオは5本で、Kubernetesネイティブな障害が中心です。
- Catalog性能低下(CPU throttle + 不正sidecar)
- Cart再起動ループ(メモリリーク)
- DB接続不可(SG削除)
- Cart遅延(DynamoDBスロットル)
- サイト全停止(NetworkPolicy過制限)
ECS Workshopと比べると、NetworkPolicyやsidecar、CPU throttleといったK8s固有の事象を扱えるのが特徴です。
Kubernetesを業務で触っている方におすすめのワークショップです。
こちらのワークショップではないですが、私も retail-store-sample-app を使ったEKSのDevOps Agent調査を試しているので参考にしてみてください。
AWS公式ワークショップ
最後にAWS主催のDevOps Agent向けのワークショップです。
現時点ではAWS主催のワークショップでのみ体験できる内容になりますが、シナリオが充実しておりDevOps Agentのユースケースとして学びが多いので参照ドキュメントとして読むメリットがあるかと思います。
Lambda単体からコンテナ、3rd Party連携、AI/MLまでをモジュール単位で網羅しており、Module構成は以下のとおりです。
- Module 1: Simple Lambda - Lambda単体障害の最小ループ
- Module 2: コンテナ障害 - ECS 10シナリオ / EKS 5シナリオ + Webhook経由でCloudWatchアラームと自動連携
- Module 3: 3rd Party連携 - Splunkログ統合と2シナリオ(Secrets Access Denied / DB SG Blocked)
- Module 4: AI/ML障害 - SageMaker系の4シナリオ(Training Job / Unhealthy Endpoint / Auto-Scaling / Pipeline Deployment)
前述のECS / EKSのGitHubサンプルはModule 2に対応する内容で、Workshopではこれに加えてSplunk連携やAI/ML系の障害シナリオまで踏み込めるのが特徴です。
最後に
DevOps Agentを評価する際のテストシナリオを5つまとめてみました。
まずは公式ドキュメントのテスト環境でDevOps Agentの基本動作を見ていただき、業務でよく扱う領域(ネットワーク / ECS / EKS)に応じて該当するシナリオを試していくことでDevOps Agentの調査能力を一通り確認できると思います。
今回のシナリオを参考にDevOps Agentの評価を進めていただけたら嬉しいです。
このブログがどなたかの参考になれば幸いです。
以上、たかやま(@nyan_kotaroo)でした。











