
AWS東京リージョンAZ障害発生時のDevelopersIOブログへの影響調査(2025/04/15)
2025年4月15日、日本時間の夕方、AWS東京リージョンの一つのアベイラビリティゾーン(apne1-az4)で障害が発生。当該AZで稼働していたEC2インスタンスや、EC2を利用するAWSサービスで、エラー率の増加や遅延などの影響が及んだ可能性が報告されました。
今回、CloudFrontとAWS東京リージョンのApp Runnerを利用している当ブログサイト(DevelopersIO)を対象に、AWSの障害報告に記載された時間帯における稼働状況を確認した結果を紹介します。
AWS Health Dashboard 情報
AWS Health ダッシュボードで公開された情報です。
詳細ページ
DevelopersIOへの影響
障害時間帯(16:30〜17:50 JST)、DevelopersIOで使用している CloudFrontおよびApp Runnerの稼働状況を確認しました。
CloudFront
- 16:43から17:14にかけて、断続的にエラー率(5xxErrorRate)が上昇しました。
- エラー率の最大値は、16:43に観測された0.106%でした。
App Runner
- 16:43から17:12にかけて、サーバーエラー(5xxStatusResponses)が8件発生したことを確認しました。
当該時間帯に稼働していたインスタンスのメトリクス(CPU使用率、メモリ使用率)を確認しました
メトリクスの記録が16:45前後に途絶えたインスタンスがあったことから、これらのインスタンスに影響が及んでいた可能性が考えられます。
一方で、3台以上のインスタンスは障害発生時間帯を通して継続して稼働していたことが確認できました。
CPU・メモリ使用率が50%台に留まる様に調整、余裕を持たせたオートスケール設定により、影響を最小限に抑えられたと考えられます。
まとめ
過去、2019年8月に発生した東京リージョン障害では、DevelopersIOにおいてエラーリクエスト数は2,700件以上、エラー率は最大で30%を超える影響がありました。
2024年に当ブログのCMS環境はSaaS(Contentful)へ移行し、自己管理するコンポーネントを減らしているため、単純な比較はできませんが、今回の障害ではエラーリクエスト数は10件未満、エラー率も0.1%未満に抑えることができました
-
2019年8月当時
-
2025年4月現在
今回の調査で、東京リージョンのAppRunnerがアベイラビリティゾーン障害に対する耐性を備えていることが確認できました。
しかし、リージョン全体が不安定になるケースも想定し、今後はCloudFrontのオリジンフェイルオーバー機能や、昨年(2024年11月)サポートされたCloudFront Functionsを用いた別リージョンへのオリジン切り替えといった対策の実現性についても検証を進める予定です。
参考URL
Amazon CloudFront、CloudFront Functions を使用したオリジンの変更を発表
AWS Post-Event Summary (2019 年 8 月)