【レポート】 新サービスAWS DevOps Agent のワークショップ 「[NEW LAUNCH] Resolve and prevent future operational issues with AWS DevOps Agentに参加しました!#AWSreInvent #DVT337

【レポート】 新サービスAWS DevOps Agent のワークショップ 「[NEW LAUNCH] Resolve and prevent future operational issues with AWS DevOps Agentに参加しました!#AWSreInvent #DVT337

2025.12.04

こんにちは!クラウド事業本部のおつまみです。

今回はre:Invent2025のセッション 「[NEW LAUNCH] Resolve and prevent future operational issues with AWS DevOps Agent」 に参加してきたので、内容をご紹介します!

AWS DevOps Agent についてはAWSブログや弊社ブログでもいくつか記事が出ています。

  • AWS ブログ

https://aws.amazon.com/jp/blogs/aws/aws-devops-agent-helps-you-accelerate-incident-response-and-improve-system-reliability-preview/

  • 速報ブログ

https://dev.classmethod.jp/articles/aws-devops-agent-25/

  • やってみたブログ

https://dev.classmethod.jp/articles/aws-devops-agent-preview-awsreinvent-troubleshooting/

https://dev.classmethod.jp/articles/aws-devops-agent-test-ec2-alert/

https://dev.classmethod.jp/articles/aws-devops-agent-multi-account-access/

セッションの概要

タイトル

[NEW LAUNCH] Resolve and prevent future operational issues with AWS DevOps Agent

概要

Application downtime impacts revenue and customer trust. This hands-on workshop demonstrates how to leverage the new frontier agent for operational excellence to accelerate incident response and prevent future incidents. Learn how to integrate AWS DevOps Agent with your existing observability tools, code repository, and CI/CD pipelines to map your applications and connect the dots for faster issue resolution. Through practical exercises, you'll leverage DevOps Agent to investigate operational issues, identify concerning trends, and obtain prioritized preventative measures. Learn best practices to reduce mean time to resolution, improve operational posture, and empower your teams to innovate, not firefight.

アプリケーションのダウンタイムは収益と顧客の信頼に影響を与えます。このハンズオンワークショップでは、運用効率を向上させるための新世代エージェントを活用し、インシデント対応を迅速化し、将来のインシデント発生を防ぐ方法を紹介します。AWS DevOps Agent を既存の可観測性ツール、コードリポジトリ、CI/CD パイプラインと統合し、アプリケーションをマッピングして点と点をつなぎ、問題解決を迅速化する方法を学びます。実践的な演習を通して、DevOps Agent を活用して運用上の問題を調査し、懸念される傾向を特定し、優先順位をつけた予防策を講じます。平均解決時間を短縮し、運用体制を改善し、チームが消火活動ではなくイノベーションを推進できるようにするためのベストプラクティスを学びます。

スピーカー

  • Yasemin Avcular, Principal Software Engineer, AWS
  • Carl Caum, Senior Product Manager, Amazon Web Services

レベル

300

Session Type

Workshop

AWS DevOps Agentとは?

AWS DevOps エージェントは、インシデントに迅速かつ自動的に対応し、サービスを迅速に復旧し、システムの回復力とパフォーマンスを継続的に向上させる、常時稼働のフロンティアエージェントです。
ワークショップ前の10分くらいサービスの特徴を説明してくれました。

私は直前にBreakoutセッションでサービス概要を掴んでから参加しました。

https://dev.classmethod.jp/articles/reinvent2025-report-cop362/

ワークショップの内容

事前にアプリケーションが展開されている環境において、以下2つのハンズオンを実行する内容でした。

  1. 基本的なCloudWatch アラームの調査
  2. 外部の観測システムである Dynatrace を使ってサービス停止に自動対応

今回時間の都合で1しか実行できなかったので、1の紹介をします。

やってみた

ステップ1: エージェントスペースを作成する

エージェントスペースは、AWS DevOps エージェントがユーザーに代わって動作する専用環境となります

  1. AWS ワークショップアカウントで AWS DevOps Agent を検索し、「セットアップを開始」をクリック
  2. エージェントスペースを以下の内容で構成し、「作成」をクリック

screencapture-127214171004-nxkohmht-us-east-1-console-aws-amazon-aidevops-home-2025-12-03-15_54_29

  • 名前: Workshop-Agent
  • 説明: re:Invent 2025 Workshop
  • プライマリアカウントの設定:新しいAWS DevOps Agentロールの自動作成を選択
  • エージェントスペース Web アプリの構成:新しいAWS DevOpsオペレーターロールの自動作成を選択

プライマリアカウント・エージェントスペース Web アプリと知らない概念が出てきたので簡単にご紹介します。

すると、数十秒くらいでエージェントスペースが作成されます。

ステップ2: Web アプリにアクセスする

エージェントスペース管理コンソールで、「オペレータアクセス」をクリックします。

CleanShot 2025-12-03 at 15.54.572x

すると、担当者がAWS DevOps Agentと対話するための画面が表示されました。

CleanShot 2025-12-03 at 15.55.412x

ステップ3: DevOps Center にアクセスする

  1. エージェントスペースで「DevOps Center」をクリックすると、環境に展開された2つのアプリケーションの自動検出されたアーキテクチャがトポロジーマップとして表示されます

CleanShot 2025-12-03 at 15.56.052x

  1. 左上のドロップダウンで詳細レベルを選択できます

CleanShot 2025-12-03 at 18.21.21@2x

Componentsにすると、各リソースが詳細にわかります。
2つのアプリケーションが入り組んでいることがわかりますね。

CleanShot 2025-12-03 at 15.58.012x

ステップ4: CloudWatch アラームを調査する

障害のシミュレーション:

DynamoDBテーブルのレコードを更新するLambdaに対して、テーブルへの書き込みを妨げる変更を加えてアラームを発生させます。

DynamoDB コンソールに移動し、特定のテーブルの書き込み容量の「プロビジョニングされた容量単位」を 250→2 に変更します。

CleanShot 2025-12-03 at 16.00.002x

すると、約1分後にDynamoDBWriteThrottleAlarm のアラームが発生します。

CleanShot 2025-12-03 at 16.03.392x

ステップ5: 手動調査を開始する

  1. AWS DevOps Agent Web アプリの「Incident Reaponce」ページに移動し、「Start Investigation」を押下

CleanShot 2025-12-03 at 16.03.522x

  1. 調査名を「Workshop CloudWatch Alarm」し、「Start Investigation」を押下

CleanShot 2025-12-03 at 16.05.132x

  1. エージェントは適切なデータを収集し、原因を調査します。

CleanShot 2025-12-03 at 16.05.342x

  1. 全ての調査が完了するまで15分かかりました。
調査結果の画像(解像度低めです)

screencapture-f2a677c2-35f8-435d-b2dc-eca50b96deb7-aidevops-global-app-aws-f2a677c2-35f8-435d-b2dc-eca50b96deb7-investigation-6ce52b6b-eba4-4474-81dd-ca245afdea48-2025-12-03-16_28_06

調査結果には以下が含まれました:

カテゴリ 内容
アラートコンテキスト ・発生時刻
・現在のメトリック値としきい値
・歴史的傾向分析
影響分析 ・影響を受けるサービスと依存関係
・顧客への影響
・ビジネス指標の相関関係
根本原因仮説 ・データに基づく最も可能性の高い原因
・裏付け証拠
・各仮説の信頼度
推奨アクション ・即時の緩和措置
・長期的な予防策
・実装ガイダンス

最後のところを見ると、書き込み容量エラーということがわかりますね。

CleanShot 2025-12-03 at 16.28.492x

ステップ6: 緩和計画を作成する

  1. 「インシデント対応」タブに移動し、「緩和計画の作成する」をクリックする

CleanShot 2025-12-03 at 16.29.152x

  1. 約1分後に緩和計画が表示されました

screencapture-f2a677c2-35f8-435d-b2dc-eca50b96deb7-aidevops-global-app-aws-f2a677c2-35f8-435d-b2dc-eca50b96deb7-investigation-6ce52b6b-eba4-4474-81dd-ca245afdea48-2025-12-03-16_31_29

ステップ7: 予防

  1. AWS DevOps Agent Web アプリの「防止」ページに移動し、「今すぐ実行」をクリックすると将来のインシデントを防ぐための改善点を特定できます。

CleanShot 2025-12-03 at 16.32.282x

おわりに

今回のワークショップでAWS DevOps Agentの実力を体験することができました!

ここまでやってくれるのかと正直驚きました。
将来のインシデント予防まで支援してくれる心強いパートナーになりそうです。

現在プレビュー段階ですが、GA後の活用が楽しみです!

最後までお読みいただきありがとうございました!
どなたかのお役に立てれば幸いです。

以上、おつまみ(@AWS11077)でした!

参考

この記事をシェアする

FacebookHatena blogX

関連記事