[アップデート] EC2 Capacity Manager にスポット中断メトリクスが追加されました
はじめに
EC2 Capacity Manager にスポット中断メトリクスが追加されました。マネジメントコンソールから、スポットインスタンスの中断状況を把握しやすくなりました。

EC2 Capacity Manager とは
EC2 Capacity Manager は、EC2 インスタンスの各種キャパシティの使用状況を可視化したダッシュボードを提供しているサービスです。オンデマンドインスタンスや、スポットインスタンス、キャパシティ予約の利用状況を一元管理できます。
詳細は以下の記事をご参照ください。
アップデート内容
今回のアップデートで、スポットインスタンス中断に関する 3 つのメトリクスが追加されました。
| メトリクス | 説明 |
|---|---|
| スポット合計数 | 選択した期間中に実行されたスポットインスタンス数または vCPU の合計数 |
| スポット合計中断 | 中断されたスポットインスタンスの数 |
| スポット中断率 | 中断を経験した実行中のインスタンスの割合 |

リージョン、AZ ごとの中断率と中断回数のサマリも確認できます。今回の検証では中断が発生しなかったため、すべてゼロで見栄えが悪く申し訳ない。

これらのメトリクスが取得できるようになったことで、異なるリージョンやアベイラビリティゾーン間で比較し、スポットインスタンスの安定性を定量的に評価できます。
検証してみた
新しく追加されたメトリクスの動作を確認するため、スポットインスタンスを起動して検証しました。
検証結果早見
検証の結果、約 3 日間に自然な中断は発生しませんでした。また、FIS による中断イベントはメトリクスにカウントされませんでした。
スポットインスタンスの起動
2025 年夏頃、t3.micro はキャパシティ不足で起動できないことがありました。今回はその t3.micro を検証対象としました。
まず東京リージョンの AZ 1a, 1c で合計 3 台を起動し、1 日稼働させましたが中断は発生しませんでした。

サンプル数を増やすために 1d にも追加でインスタンスを起動しました。

最終的に、東京リージョンの各 AZ に t3.micro を 1 台ずつ起動しました。t3a.micro は ap-northeast-1a のみに起動し、合計 4 台のスポットインスタンスを用意しました。

FIS で中断イベントを発生させる
約 1 日と数時間経過しても自然な中断が発生しなかったため、AWS Fault Injection Service(FIS)を使用して中断イベントを発生させました。
FIS によるスポット中断のテスト方法は以下の記事をご参照ください。
EC2 コンソールから中断イベントを発生させます。

インスタンスが停止していきました。

4 台中 2 台に中断イベントを発生させました。スポットリクエストのステータスは以下の通りです。

EC2 Capacity Manager のグラフに反映されるまで時間がかかりました。 約 1 日放置後、vCPU 数のグラフを見るとスポットインスタンスが減少していることを確認できるようになりました。

検証結果
FIS による中断イベントは、スポット中断メトリクスにはカウントされませんでした。

FIS による中断イベントはメトリクスにカウントされないため、実際の中断のみが記録されるメトリクスであることがわかりました。
まとめ
EC2 Capacity Manager にスポット中断メトリクスが追加されました。
- スポットインスタンスの中断状況をマネージメントコンソールから視覚的に確認できる
- リージョン、AZ ごとの中断率を比較ができる
- 中断傾向の把握し、インスタンスタイプや AZ の選定に活かせる
スポットインスタンスを利用している環境では、このダッシュボードを確認することでコスト最適化と可用性のバランスを検討できるようになっています。
おわりに
EC2 Capacity Manager は利用費のかからないサービスです。機能を有効化しないとメトリクスの取得及び、可視化が提供されないため、スポットインスタンスを利用している環境では有効化しておき、定期的にチェックしてみると良いのでないでしょうか。
スポットインスタンスの起動確率を予想したいなら、スポットプレースメントスコアも確認するとよいでしょう。
現時点のスポットインスタンスの価格を確認したいなら、スポットインスタンスアドバイザーか、非公式ツールではありますが便利な spotinfo を使うと良いです。
みなさまのスポットインスタンスを駆使した経済的な AWS 活用を応援しています。






