[ブース紹介]カオスエンジニアリングを体感できる「Chaos Kitty」で大規模障害が起きるハードモードを復旧してみた #AWSSummit

AWS Summit Tokyoで展示されていたカオスエンジニアリングを競技感覚で楽しく学べるChaos Kittyにチャレンジしたので紹介です。今回はハードモードにチャレンジしました。
2023.04.22

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、臼田です。

みなさん、AWS Summit楽しみましたか?(挨拶

今回は幕張メッセで行われたAWS Summit Tokyoで実施をしていた、カオスエンジニアリングを体感できる「Chaos Kitty」という展示に挑戦してみました。以下のようなものです。

実際にAWS環境で障害を起こし、AWSマネジメントコンソールを使いながら修復するゲームなのですが、この画像のイメージだけでもよくわからないと思うので、その場で受けた説明と実際の挑戦中の画像を使って紹介していきます。

概要

Chaos Kittyは前述の通り、AWS環境で障害を意図的に発生させて、これを直していくというゲームです。

AWSが展示するDeveloper Loungeにて展示されていました。

色々ランプが光っていますが、これらは動いているサービスリソースの状況を表していて、緑なら正常、赤は異常(障害発生中)という感じになっています。

画像からは分かりづらいですが、リソースアイコンの旗も立っていて、S3のランプやEC2のランプ、RDSのランプなど色々あります。レゴとかで環境が組まれていて楽しいですね。

通常ランプは全部緑色なのですが、手前についている2つの丸いボタン(緑と赤)を押すと、障害が発生してランプが赤く変わるようになっています。

ボタンを押してから、すべてのランプを緑に戻すまでのタイムを競うゲームとなり、そのタイマーやランキングが正面の液晶に表示されています。

競技感覚で障害を調査したり復旧することで、楽しく学ぶことができますね。

やってみた

というわけでやってみました。といっても今回は私ではなく、一緒にいた同僚のたかくにさんに挑戦してもらいました。がんばえー!

開始のボタンは緑がイージーモード、赤がハードモードということで、私は「ハードで行きましょう」と言いました。当然ですね。

ボタンを押して開始します。上の画像ではすべてのランプが緑ですが…

すぐに真っ赤に変わりました。ちなみにイージーモードだと、どれか1つがランダムで赤くなるらしいのですが、ハードモードはほぼ全部赤くなるらしいです。

先程のツイートの画像にひっそり乗っていましたが、向かって右側に構成図が貼ってあるので、これとAWSマネジメントコンソールをにらめっこしながら、まずはS3の状況から確認していきました。

ははーん、なるほど、そうなっているのか。

と私は後ろで楽しみながらシャッターを切りまくってました。

RDSやEC2も次々と緑になっていき…

全部緑になりました!タイムは…?

2分16秒68!どれくらい速いのかというと、画像右下にあるハードモードのランキングには入っていないものの、それに近いタイムであることから結構速いのではと思います。

ちなみにこのChaos Kittyにはアレクサも一緒に置いてあって、修復を依頼すると自動的に環境を復旧してくれるそうです。この用意されているランブック(何かあったときに実行する自動化されたスクリプトなど)がいかに大事かということも学べるようになっているそうです。

終了後、Chaos Kittyのステッカーなどをいただきました。猫かわいい。

まとめ

カオスエンジニアリングを競技感覚で楽しく学べるChaos Kittyを紹介しました。また何かのイベントで展示するかもしれないので(未確認)ぜひ見かけたらチャレンジしてみましょう!