【ブースレポート】  人間 vs AI 障害対応バトル - Chaos Kitty Challenge - を体験してきました

【ブースレポート】 人間 vs AI 障害対応バトル - Chaos Kitty Challenge - を体験してきました

2026.07.03

こんにちは
昨日のお酒がヘアピンNAT
運用イノベーション部のかわいです。

今回は AWS Summit 2026 ブースレポート第3弾として、AWS Builders' Fair で開催されていた「人間 vs AI 障害対応バトル - Chaos Kitty Challenge -」を紹介します。

人間 vs AI 障害対応バトル - Chaos Kitty Challenge -

Chaos Kitty AIと戦おう!

Chaos Kitty と題された AWS さんのブースでは、昨年12月の re:Invent で発表された DevOps Agent を活用した、人間 vs AI のトラブルシューティング対決が紹介されていました!

シナリオが3種類ほどあり、とあるアーキテクチャで稼働している環境で複数のトラブルが発生し、AI と解消に至るまでの経過時間を競う、という内容(アーキテクチャは以下)。
architecture

事象発生後、Step Functions で定常的にリソース状態を確認し、問題・解消状態をチェックします。
その間 DevOps Agent は診断を行い、例えばどこがインターネットへの経路を確保できていないか等を調査し、是正内容を出力します。
人間は簡易的な構成図しか与えられないため、ヒントとして問題が発生している箇所を示すパトランプがアラーム状態として点滅します(後述)。

difficulties

難易度は3種類から選択可能。
私はあいだを取って HARD を選びました。

lamps

開始後、問題発生箇所が↑のように光ります。
今回のシナリオでは、Security Group 2個所と、EC2インスタンスが点滅しました。

ヒントとシナリオ用構成図を元にマネジメントコンソールから確認したところ、EC2が停止状態だったため起動させました(→解消)。
SG もイングレスで許可する必要のあるポートが設定されていなかったため追加(→解消)。

無事、約5分ほどで解消させることができました。

が、
investigation

さすが DevOps Agent。すぐに ALB からの通信を遮断してしまっている箇所を突き止め、約4分程度で是正提案までが完了していました(負けたくやしい)。

まとめ

コンセプトも良く社内研修等で使えそうなのと、全体のアーキテクチャもコスト感を抑えつつ再現できそうなのも素晴らしいと感じました。特に Alexa Echo に連携させ、障害発生箇所をランプで知らせる、というのも斬新でした。
DevOps Agent の有用性をあらためて感じられたブースでした。楽しかった

この記事をシェアする

関連記事