【ブースレポート】 ゲームで障害対応を体験!「AWS レジリエンス体験ゲーム」で遊んでみた

【ブースレポート】 ゲームで障害対応を体験!「AWS レジリエンス体験ゲーム」で遊んでみた

2026.06.25

こんにちは!クラウド事業本部のおつまみです。

AWS Summit Japan 2026、楽しんでますか?
本記事では、ゲームで楽しく障害対応を学べるブース「AWS レジリエンス体験ゲーム」で遊んできたので、ブースレポートとしてご紹介します。

場所はこの青色枠あたりになります。

CleanShot 2026-06-25 at 17.38.17@2x

AWS レジリエンス体験ゲームとは

「AWS レジリエンス体験ゲーム」(ブース番号 A139)は、その名のとおり障害対応をゲーム形式で体験しながら、AWS上でのレジリエンス(回復性・耐障害性)の考え方を学べるブースです。「障害対応を体験して、レジリエンスを学ぼう」というメッセージが掲げられていました。

1000012850

大型ディスプレイにはゲーム画面が映し出されており、画面内には「習得したキーコンセプト」として以下のようなレジリエンスの設計要素がチェックリスト形式で並んでいました。

  • マルチAZ高可用性
  • ゾーン分離
  • 影響範囲の局所化
  • ヘルスチェック設定
  • アプリケーションレベルのヘルスチェック
  • クライアント側障害処理
  • 多次元障害検知
  • ゾーンシフト
  • カオステスト
  • 段階的トラフィック移行

障害対応の現場で重要になる考え方が、ゲームを通じて体系的に学べるようになっています。

シナリオを選んでプレイ

ゲームはタブレットで操作する形式で、まずはシナリオを選ぶところから始まります。
「各シナリオで異なるレジリエンスの原則を学べます」とのことで、用意されていたのは次の4つのシナリオでした。

CleanShot 2026-06-25 at 17.43.062x

  • StreamMax(ライブストリーミングプラットフォーム / HIGH):同時視聴者1,000万人。世界最大のライブイベント中にアベイラビリティゾーン障害が発生
  • ShopFast(URGENT):フラッシュセールに5,000万人の顧客。プラットフォーム全体に広がる連鎖障害
  • DoWell AI(URGENT):5万人の従業員が回答を得られない。最も必要な時にAIアシスタントが停止
  • FinancePay(CRITICAL):1日5億ドルの取引。大陸をまたぐ金融オペレーション障害

それぞれリスクレベルが設定されており、難易度や扱うテーマが異なるのが面白いポイントです。

障害発生!リアルタイムで対応

シナリオを開始すると、ライブ視聴者数やスコア、ステージの進捗が表示されたゲーム画面に切り替わります。
今回プレイしたStreamMaxでは、「グローバルゲーミングチャンピオンシップ決勝戦」というシチュエーションで、ライブ視聴者がリアルタイムに増えていく中で対応を進めていきます。

CleanShot 2026-06-25 at 17.43.122x

プレイを進めていくと、突然「アラートシステム」から障害発生の通知が飛んできます。
今回は「アベイラビリティゾーン障害。AZ-Aで電源問題が発生しています。サーバーがオフラインになっています…」というアラートが発生しました。

CleanShot 2026-06-25 at 17.43.182x

ライブ視聴者数が増え続けるプレッシャーの中で、どのように障害の影響範囲を抑え、サービスを継続させるかを判断していきます。マルチAZ構成やゾーンシフトといった、先ほどの「キーコンセプト」が実際の対応の中で活きてくる作りになっており、遊びながら自然とレジリエンスの設計思想が身につく体験でした。

クイズ形式で設計判断を問われる

障害対応を進めていくと、ところどころでクイズ形式の設問が登場します。
レジリエンスの設計判断を、選択肢の中から選んで答えていく形式です。

1000012852

たとえば「RPO=0と自動フェイルオーバーをどう保証しますか?」という設問では、次の3つの選択肢が提示されました。

  • A:同期レプリカ + Route 53 ヘルスチェック + ARC切り替え
  • B:同期レプリカ + インシデント時の手動 Route 53 更新
  • C:非同期レプリカ + Route 53 ヘルスチェック

RPO=0(データ損失ゼロ)を実現するには同期レプリカが必要で、かつ自動フェイルオーバーを実現するにはヘルスチェックと自動的な切り替えの仕組みが欠かせない、という設計の勘どころを問う良問でした。
単に用語を知っているだけでなく、要件(RPO=0・自動フェイルオーバー)から正しい構成を選べるかが試される内容で、思わず考え込んでしまいました。

解説資料でしっかり学べる

ブースの卓上には、ゲームに登場するキーコンセプトを解説したシートも用意されていました。

1000012856

たとえば「ゾーン分離(Zonal Isolation)」のシートでは、障害の影響範囲をAZ単位に限定し、他のAZへの波及を防ぐ設計パターンとして、次のようなポイントが整理されていました。

  • 各AZは独立した障害ドメイン(Fault Domain)として機能する
  • 電源・ネットワーク・冷却が物理的に分離されており、AZ間の依存関係を最小化する
  • 各AZで独立してリクエストを処理できるよう設計する
  • 障害検知とルーティング変更を組み合わせて障害AZを素早く切り離す
  • AZごとに独立したヘルスチェックを設定し、異常を個別に検出する

また、別のシートには障害の影響範囲を示す「Blast radius(影響半径)」の考え方も図解されており、ゲームで体験した内容を理論面からも理解できるようになっていました。遊んで終わりではなく、設計の裏付けまで持ち帰れるのが嬉しいポイントです。

最後に

本記事では、AWS Summit Japan 2026の「AWS レジリエンス体験ゲーム」ブースについてブースレポートとしてご紹介しました。

レジリエンスは、ドキュメントやセッションで学ぼうとすると少し抽象的に感じてしまいがちなテーマですが、このブースでは「障害が起きたらどう動くか」をゲームで疑似体験することで、設計の勘どころを直感的に理解できる工夫がされていました。
マルチAZやゾーンシフトといったキーワードを、自分ごととして体感できる良いブースだったと思います。

会場で見かけた際は、ぜひ実際にプレイしてみてください!

最後までお読みいただきありがとうございました!
どなたかのお役に立てれば幸いです。

以上、おつまみ(@AWS11077)でした!

この記事をシェアする

AWSのお困り事はクラスメソッドへ

関連記事