
DevOps Agentの完了した調査(Investigation)から継続調査を実行してみた
こんにちは。たかやまです。
最近DevOps Agentにいろいろなインシデント調査を任せているのですが、調査が仮説止まりで終わってしまうことがありました。
そういうとき、こちらから情報提供して、もう一度調査を実行してほしいケースがあると思います
調査をする中で一度完了したDevOps Agentの調査を、追加の情報をもとに継続して調査できたので今回は継続調査について紹介したいと思います。
さきにまとめ
- 継続調査はチャットからプロンプトから依頼することで可能
- 執筆時点では、Investigation画面に再調査用のボタンのようなUIはなし
- 追加した調査は「ステアリング」として既存の調査に統合され、根本原因がバージョン管理(v1→v2)される形で更新される
- 緩和計画も新しい調査内容を反映してアップデート可能
やってみる
こちらのサンプルシナリオを東京リージョン(ap-northeast-1)で実行してみます。
このスタックはus-east-1リージョンで作成を想定されているので、東京リージョンで実行するとBedrockアクセスエンドポイント周りでエラーが出るのでそちらの調査対応を依頼してみます。

初回調査
BedrockアクセスについてのCloudWatch Alarmのアラートが上がっているのでこちらの調査を依頼してみます。


調査結果がこちらです。
今回の調査では核心的な問題に辿り着けずに、仮説止まりになっています

ちなみに仮説止まりのため 緩和アクション も今回は作成されませんでした。

再調査
では、ここからユーザー側が心当たりを持っている情報をもとに追加調査を依頼したいと思います。
ただ、Investigation画面から再調査のUI的なものは執筆時点では見当たりません

そこで、チャットから以下のようなプロンプトを投げて再調査を依頼してみます。
「調査 2026-05-26T03:00:25.260Z」の調査について、ap-northeast-1に sample-automated-aws-devops-agent-network-incident-response をデプロイしたことが問題かもしれないのでその観点をいれて継続調査させて
本来は us-east-1 にデプロイを想定しているスタックです。
すると既存の調査に追加する形でDevOps Agent自体が調査を実行しました。
追加された内容は「ステアリング」という項目で追加されているのが確認できます。

根本原因についても既存の調査はv1として v2 という形で表示されていました。
今回は無事 根本原因 までたどり着いていることが確認できます。

緩和計画 についても新たな調査が行われたことで アップデートできる内容が表示されてるので実行してみます。

実行した結果がこちらです。
今回問題となっているアクセスエンドポイントの問題にたどり着いて変更計画を立ててくれていますね
緩和計画については根本原因と違いバージョン管理はされていなさそうですね
(もしかしたら前回の調査で緩和計画がちゃんと生成されていたらこちらもバージョン管理される可能性もあります)

Appendix : APIがないか確認してみる
ここまではチャット経由で継続調査を依頼してきましたが、CLIから同じことができないかも確認してみました。
DevOps Agentには devops-agent CLIが用意されています。
チャット上で実行されているAPI?は steer_task という内容で、これに完全一致するAPIは現在のCLIにはなさそうでした。

せっかくなので、もっと近そうなバックログタスクを更新する update-backlog-task を使ってみます。
ただ、このコマンドで更新できるのは --task-status(タスクのステータス)だけで、調査内容を追記したり継続調査の指示を渡したりするためのパラメータはなさそうです。
加えて、ドキュメントやCLIヘルプ上は IN_PROGRESS や COMPLETED を含む9種類のステータスが指定できるように見えるのですが、実際に叩いてみると指定できるのは PENDING_START と CANCELED の2種類だけでした。
aws devops-agent update-backlog-task \
--agent-space-id <AGENT_SPACE_ID> \
--task-id <TASK_ID> \
--task-status IN_PROGRESS \
--region ap-northeast-1
An error occurred (ValidationException) when calling the UpdateBacklogTask operation: Only PENDING_START or CANCELED status is allowed for task updates
「完了済みの調査をもう一度動かしたい」という意図に一番近そうな PENDING_START を指定してみたのですが、実行直後にステータスが FAILED に変わってしまい、こちらの方法では継続調査はできませんでした。
aws devops-agent update-backlog-task \
--agent-space-id <AGENT_SPACE_ID> \
--task-id <TASK_ID> \
--task-status PENDING_START \
--region ap-northeast-1
IN_PROGRESS や COMPLETED はエージェント側が内部で管理するステータスで、ユーザーが外から指示できるのは「開始させる」か「キャンセルする」かのどちらかという作りになっていそうです。
執筆時点では、継続調査はチャットからプロンプトで依頼する経路で、それ専用のAPIはまだなさそうですね
最後に
DevOps Agentで一度完了した調査を継続調査できるのか試してみました。
専用のUIやAPIはまだ見当たりませんでしたが、チャットからプロンプトで依頼すれば既存の調査にステアリングとして追加され、根本原因や緩和計画まで掘り下げてもらえることが確認できました。
仮説止まりで終わってしまった調査も、こちら側の情報を渡すことで核心にたどり着けるケースがありそうなので、調査が物足りなかったときの一手として覚えておくと便利そうです。
以上、たかやま(@nyan_kotaroo)でした。







