EKS Fargate Pod のメンテナンスでダウンタイムは発生するか教えてください
困っていた内容
EKS Fargate で Pod を実行しています。
AWS からメンテナンスのため Pod を退避(eviction)する予告通知が届きましたが、ダウンタイムが発生するか教えてください。
ダウンタイムは発生するの?
状況によっては、発生する可能性があります。
通知された日時までに Pod を再起動しない場合、設定した PDB(Pod Disruption Budget)に基づいて Pod が終了されます。
Pod の退避が失敗した場合、通知が行われ、改めて再試行されますが、最終的に通知なしで Pod およびその基盤となる Node は終了されます。
AWS では Pod に PDB を設定することを推奨しており、また通知された期限よりも前に Pod を再起動することも推奨しています。
ダウンタイムが許容できないシステムでは、事前に再起動することを検討してください。
参考資料
Amazon EKS は定期的に AWS Fargate ノードの OS にパッチを適用し、ノードを安全に保ちます。パッチ適用プロセスの一環として、ノードをリサイクルして OS パッチをインストールします。更新は、サービスへの影響を最小限に抑える方法で試行されます。ただし、Pod のエビクションが正常に行われない場合は、Pod を削除する必要がある場合があります。以下に示しているのは、中断の可能性を最小限に抑えるために実行できるアクションです。
- 適切な Pod の中断予算 (PDB) を設定して、同時にダウンする Pod の数を制御します。
- Pod が削除される前に、失敗したエビクションに対応する Amazon EventBridge ルールを作成します。
- 受信した通知に記載されているエビクション日よりも前に、影響を受けるポッドを手動で再起動します。
- AWS User Notifications で通知設定を作成します。









