[レポート][TA-09] AWS System Operation Deep Dive #AWSSummit
ウィスキー、シガー、パイプをこよなく愛する大栗です。 AWS Summit Tokyo 2015のTA-09:AWS System Operation Deep Dive (Monitoring / Logging / Configuration)についてのレポートです。
レポート
システム基盤運用で考えるポイント
以下の3点がシステム基盤を運用する上でポイントになります。
- Monitoring(監視) 死活、キャパシティ、性能など AWSサービスで軽減できることが可能
- Logging(ロギング) 自動化があるのでロギングが重要
- Configuration(構成管理)
Monitoring(監視)
Amazon CloudWatchの概要
AWSの各種リソースを監視するサービスです。 多くのAWSサービスの監視が可能。 AWSの課金情報の監視。
CloudWatchのコンセプト
色々な切り口で表示できる。 データポイントをまとめて管理して表示する。 Metric → Namespace → Dimension RowDataとしてデータを見ることはできない。 Sum、Max、Min、Average、Sampleの結果が表示される。
Amazon CloudWatchに対応するAWSサービス
最近WorkSpacesが対応
Amazon CloudWatchを使ったモニタリング
CLIでデータを取ってきて、既存の監視ツールにデータを持ってくる。
監視システムとのAmazon CloudWatch連携
CloudWatchと3rd Party監視ツールを組み合わせる。 CloudWatchは2週間しかデータを保持しない。
Mackerelを使ったモニタリング
オートスケーリングの台数増減を表示できる。 Slackで負荷状況を添付して通知できる。
Sensuを使ったモニタリング
cloudpack様の事例で、スタンドアロンでRabbitMQにデータを投入して、スケールする構成にしている。
CloudWatch Logs
Linuxの場合はエージェントをインストール。Windowsの場合はEC2Configを使用する。
転送できるログメッセージの長さの制限
Agentが1回あたりプッシュできるログレコードサイズは最大32KB 32KBを越えるとログがトランケートされる。 どうしても超える場合はログのカットが必要
対応しているログローテーション
- Rename and Re-create
- Copy and Truncate
- Create common-patterned file
ログの転送設定
file_fingerprint_linesの設定内容に注意。ファイルの同一確認に使用される。
メトリクスフィルタ(一般的なログフォーマット)
Amazon CloudWatchのアクション機能
モニタリング → アクション
Logging(ロギング)
AWS CloudTrail
ユーザがAPIを発行 ↓ 各リージョンのAWSリソースの呼び出し ↓ CloudWatch Logs、S3
AWS CloudTrailログの利用ケース
検知 検索 可視化
CloudWatch Logs Metrics Filterの利用
CloudTrailとCloudWatch Logsの連携 特定の文字列のフィルタリング CloudFormatiobテンプレートが提供されている
AWS CloudTrail APU Activity Lookup
直近7日間について表示可能 ただしCloudTrailのサポートするメトリクス全部が対応するわけではない。
CloudTrailの可視化
本格的に可視化する場合は、以下のような構成が考えられる
- Amazon CloudSearch、AWS Lambdaの連携
- ElasticSearch、Kibana、Amazon Lambdaの連携
- Splunk App for AWS
Configuration(構成管理)
AWS Configがローンチ(最近東京でも利用可能)
構成変更 ↓ 記録 ↓ 変更・更新 ↓ ヒストリ・スナップショット
AWS Configから見るリソースのリレーション
特定のリソースに関連するリソースが参照可能。 例えばセキュイティグループの紐づくインスタンスの一覧が見える。
AWS Configからのスナップショットの取得
Logstorageによる可視化
まとめ
運用に関するAWSサービスは以下のようなものがある。
- モニタリング:CloudWatch
- インフラ監視:CloudTrail
- 構成管理:AWS Config
上記サービスがあるが、3rdパーティのサービス、ソフトウェアを使用して仕組みを補完することが重要。
さいごに
運用管理を進めていくためにESPやAWS運用管理コミュニティをうまく活用していきましょう。