Developers.IOにある 冗長化(マルチAZ、マルチリージョン)、監視、障害対応などの記事をまとめてみた(全116個)

先日の東京リージョンで発生したEC2とEBSの障害について、振り返ってみれば、

  • 冗長化しておく
  • 適宜バックアップを取っておく
  • ログをすぐ可視化できる仕組みを構築しておく
  • 障害発生時の対応を検討・シミュレートしておく

などによって、影響を軽減できたと言えそうです。 もちろん、このあたりは「事業内容や構築しているシステムで必要な稼働率、予算」などで考え方や実現できる内容は異なると思います。

ところで、AWSには責任共有モデルがあり、AWSと利用者がそれぞれ行うべきことを定義しています。 利用者がこれを行うための手段として、AWS Well-Architectedも提供しています。

本記事では、これまで培ってきたDevelopers.IOの記事から、冗長化・監視・障害対応などの記事をピックアップしてまとめてみました。 少しでも参考になると幸いです。

なお、本記事は今後も適宜アップデートしていきます。差分は最後の更新履歴をご覧ください。

目次

はじめに

検索ワード

Developers.IOを下記で検索し、ヒットした記事をピックアップしています。

  • 障害
  • 監視
  • マルチリージョン、Multi Region
  • AZ、Availability Zone、アベイラビリティーゾーン
  • 冗長
  • リカバリ
  • バックアップ、backup
  • スナップショット、snapshot
  • 復旧、復元

前提

  • ピックアップ対象は2018年1月以降に投稿された記事のため、最新でない記事もあると考えられます
    • 「2018年以前だけどこの記事良いよ」な記事は掲載しています
  • 運用、監視、障害対応などが対象です(セキュリティ観点は含みません)
  • 記事のタイトルで一次判断し、内容で二次判断しています

まずは現状確認を!

AWS Well-Architectedをじっくり確認し、「AWSに構築しているシステムはどうだろう?」と現状確認し、改善点の洗い出しや改善方法の検討などを実施するのが良さそうです。

その際には、各サービスのベストプラクティスも確認するとヒントが得られるかもしれません。

ベストプラクティスがあるものについては、「サービス名 + ベストプラクティス」で検索すればHitすると思います。

Developers.IOからピックアップ

AWS概要

Well-Architected Framework関連

全般

信頼性

運用の優秀性

Availability Zone関連

全般

EC2

RDS

ALB系

MongoDB

マルチリージョン関連

設計

IoT

デプロイ

SLA関連

全般

監視・通知

ログ出力

監視(モニタリング)

全般

Route 53

Kubenetes

ツール

電話通知

Slack通知

検索・可視化

新機能リリース系

RDS

ALB系

Buckup

DLM

CloudWatch

DynamoDB

App Mesh

Mackerel

障害に備える

全般

EC2

RDS

バックアップ

Elasticsearch Service

Lightsail

障害対応・復旧・復元

実際にやってみた

EC2

RDS

Redshift

書籍

更新履歴