[アップデート] AWS Direct Connect のフェイルオーバーテストが実行可能になりました

「やってみた記事」じゃなくてスミマセン。本当にやってみた記事、お待ちしています。
2020.06.04

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

本日のアップデートで AWS Direct Connect のフェイルオーバーテストが実施可能になりました。

何がうれしいのか

これまで AWS Direct Connect を BGP セッションを意図的に失敗させてフェイルオーバー発動させるようなテストをユーザー側で実施することは出来ませんでした。

今回のアップデートによってユーザー側でフェイルオーバーのための BGP セッションのシャットダウンをトリガーすることが出来るようになりました。これにより、本当に耐障害性のあるネットワークとして構成できているかを実環境でテストにて確認することが可能となりました。

API で BGP セッションのダウンが可能となりましたので、カオスエンジニアリングを導入されている環境であれば、VIF のダウンというのも組み込むことが出来ますね!

やってみる

と、言いたいところですが気軽に BGP セッションをダウンさせられる環境がありませんので、コンソールの確認と公式ガイドの引用でご容赦ください。

Direct Connect 管理コンソールより、[仮想インタフェース] を開き対象となる VIF を指定します。[アクション] メニューを確認すると、以下のようにフェイルオーバーテストの項目が増えていますので [BGP を停止させる] をクリックします。

[障害テストの開始] ダイアログボックスが表示されます。[テストの最大時間] で指定した時間 BGP セッションがダウンするようですね。ダウン時間を入力し、確認メッセージを入力したのち [確認する] をクリックすると BGP セッションがダウンします。(ご利用は計画的に!)

テストの最大時間を経過するか、[アクション] メニューの [テストをキャンセル] によってテストは完了します。

VIF のモニタリング

先日 Direct Connect の VIF について CloudWatch メトリクスでモニタリング出来るようになりましたので、これらを利用することで切り替わった VIF で通信が継続できていることを確実に確認することができますね。

テスト履歴

各 VIF の詳細情報に [テスト履歴] タブが追加されています。実行履歴は 365 日間、保持されます。

さいごに

今回のアップデートでユーザー側で AWS コンソールおよび AWS CLI などから簡単に BGP セッションの切断テストが可能となりました。

いざというときに想定した動きをしませんでした!とならないためにも、導入の際はフェイルオーバーテストを実施したほうが良さそうですね!

以上!大阪オフィスの丸毛(@marumo1981)でした!