Developers.IOにある冗長化（マルチAZ、マルチリージョン）、監視、障害対応などの記事をまとめてみた（全116個）

これまで培ってきたDevelopers.IOの記事から、冗長化・監視・障害対応などの記事をピックアップしてまとめてみました。少しでも参考になると幸いです。

AWS

藤井元貴

2019.08.28

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

先日の東京リージョンで発生したEC2とEBSの障害について、振り返ってみれば、

冗長化しておく
適宜バックアップを取っておく
ログをすぐ可視化できる仕組みを構築しておく
障害発生時の対応を検討・シミュレートしておく

などによって、影響を軽減できたと言えそうです。もちろん、このあたりは「事業内容や構築しているシステムで必要な稼働率、予算」などで考え方や実現できる内容は異なると思います。

ところで、AWSには責任共有モデルがあり、AWSと利用者がそれぞれ行うべきことを定義しています。利用者がこれを行うための手段として、AWS Well-Architectedも提供しています。

本記事では、これまで培ってきたDevelopers.IOの記事から、冗長化・監視・障害対応などの記事をピックアップしてまとめてみました。少しでも参考になると幸いです。

なお、本記事は今後も適宜アップデートしていきます。差分は最後の更新履歴をご覧ください。

はじめに

検索ワード

Developers.IOを下記で検索し、ヒットした記事をピックアップしています。

障害
監視
マルチリージョン、Multi Region
AZ、Availability Zone、アベイラビリティーゾーン
冗長
リカバリ
バックアップ、backup
スナップショット、snapshot
復旧、復元

前提

ピックアップ対象は2018年1月以降に投稿された記事のため、最新でない記事もあると考えられます
- 「2018年以前だけどこの記事良いよ」な記事は掲載しています
運用、監視、障害対応などが対象です（セキュリティ観点は含みません）
記事のタイトルで一次判断し、内容で二次判断しています

まずは現状確認を！

AWS Well-Architectedをじっくり確認し、「AWSに構築しているシステムはどうだろう？」と現状確認し、改善点の洗い出しや改善方法の検討などを実施するのが良さそうです。

その際には、各サービスのベストプラクティスも確認するとヒントが得られるかもしれません。

ベストプラクティスがあるものについては、「サービス名 + ベストプラクティス」で検索すればHitすると思います。

Developers.IOからピックアップ

AWS概要

Well-Architected Framework関連

全般

信頼性

運用の優秀性

Availability Zone関連

全般

EC2

EC2 Auto Scaling グループの「ヘルスチェックの猶予期間」を正しく理解する

RDS

ALB系

複数のAvailability ZoneにプロビジョニングしたELB(ALB) / AutoScaling Groupから特定Availability Zone上のリソースをパージする

MongoDB

[MongoDB] AWS 3 Availability Zone 構成でのレプリカセットノード配置

マルチリージョン関連

設計

IoT

[レポート] AWSで実現するマルチリージョンIoT 〜Analog Devicesの事例を添えて〜

デプロイ

[AWS CDK(Cloud Development Kit)] 複数アカウント・複数リージョンへのデプロイを管理する

SLA関連

全般

監視・通知

ログ出力

アプリケーション動作ログ、ERRORで出すか? WARNで出すか? 〜岡山城で話してきました #cmdevio2019

監視（モニタリング）

全般

Route 53

Route 53のヘルスチェック情報で月間合計ダウンタイムと稼働率を計算してみた

Kubenetes

【レポート】Kubenetes監視のベストプラクティスを伝授！ZOZOTOWNの成功レシピより #AWSSummit

ツール

電話通知

Slack通知

検索・可視化

新機能リリース系

RDS

ALB系

Network Load Balancer（NLB）でクロスゾーン負荷分散が可能になりました

Buckup

DLM

CloudWatch

障害に備える

全般

CloudFrontを利用してオリジンサーバー障害時にS3上のコンテンツを表示する

EC2

RDS

RDS for MS SQL Server のネイティブバックアップ（完全/差分）を調べてみた

バックアップ

Elasticsearch Service

【Amazon Elasticsearch Service】手動スナップショットからリストアする方法

目次

はじめに

検索ワード

前提

まずは現状確認を！

Developers.IOからピックアップ

AWS概要

Well-Architected Framework関連

全般

信頼性

運用の優秀性

Availability Zone関連

全般

EC2

RDS

ALB系

MongoDB

マルチリージョン関連

設計

IoT

デプロイ

SLA関連

全般

監視・通知

ログ出力

監視（モニタリング）

全般

Route 53

Kubenetes

ツール

電話通知

Slack通知

検索・可視化

新機能リリース系

RDS

ALB系

Buckup

DLM

CloudWatch

DynamoDB

App Mesh

Mackerel

障害に備える

全般

EC2

RDS

バックアップ

Elasticsearch Service

Lightsail

障害対応・復旧・復元

実際にやってみた

EC2

RDS

Redshift

書籍

更新履歴

関連記事

EVENTS