AZ 障害発生時、EC2 Auto Scaling はどの様な動作をするか教えてください

2023.04.07

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

困っていること

複数のアベイラビリティゾーン(AZ) に跨るように Amazon EC2 Auto Scaling を設定しています。アベイラビリティゾーン(AZ) 障害発生時ではどの様な挙動をするのか教えてください。  

※例

  • 東京リージョン(ap-northeast-1)
  • 3AZ 構成
  • 6 台起動

どう対応すればいいの?

EC2 Auto Scaling 動作原理として

  • 指定された数の EC2 インスタンスを維持する
  • 使⽤可能な AZ の間で均等に EC2 インスタンスを配置しようとする

そのため、AZ 障害時においても使用可能な残っている AZ の間で均等に希望容量を維持しようと動作します。その後、サブネット定義が残っている限りは障害になった AZ での起動をゆるやかに試みるよう内部的にリトライを続ける動作を行います。
3AZ 構成で 6 台の構成の場合、AZ 復旧後は元の 2:2:2 構成になります。

参考情報 (P23,24)

補足

Auto Scaling グループの作成時には、特別な理由がない限りそのリージョンで使⽤可能なすべての AZ が含まれるようご検討ください。
追記、類似事象について検証しました。

参考資料