[レポート]BBCの事例: すべてをモニタリングする – Amazon CloudWatch in Action #reinvent #DEV302

2018.11.29

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

本記事はre:Invent 2018のセッション「Monitor All Your Things:Amazon CloudWatch in Action with BBC」のレポートです。

概要

Come learn what's new with Amazon CloudWatch, and watch as we leverage new capabilities to better monitor our systems and resources. We also walk you through the journey that BBC took in monitoring its custom off-cloud infrastructure alongside its AWS cloud resources.

スピーカー

  • Brian Dennehy - Director, Software Development, AWS
  • Christopher Darlaston - Development Lead, BBC

レポート

前半 - なぜモニタリングが重要なのか

前半はBrian氏から、オペレーションからビジネスへとログを通じて価値を繋ぐためのモニタリングの重要性について説明がありました。

  1. 可視化
  2. リアルタイムトラブルシューティング
  3. カスタマー・エクスペリエンス
  4. アプリケーション = お金を生む

Amazon CloudWatch

システムリソースとアプリケーションの状況を完全に可視化できる

  • スケーラビリティ
  • メトリクスとログの統合ソリューション
  • 自動でのモニタリング
  • クラウドネイティブ

価値を生むための流れは「メトリクスやログの集約 -> モニタリング・可視化 -> アクション -> 分析」という流れになる

後半 - BBCの事例

後半はChristopher氏からBBCの事例紹介がありました。

BBCのモニタリングのアーキテクチャ

  • アーキテクチャはシンプルにAmazon CloudWatchとAmazon S3, DynamoDB
  • CloudWatch agentを通して、メトリクスとログを収集する
  • ログからメトリクスを抽出し収集する
  • CloudWatch alarmを使ってアラートを送る
  • オンプレかAWSかどちらに問題がるか診断する
  • インシデント発生中にダッシュボードが柔軟に作られる(Automatic Dashboardの機能)

AWS CloudWatchを使ったモニタリングから何を学んだか

  • 問題を分割する
  • 何もかもログを集める
  • 問題が分かる正しいダッシュボードを作る

AWS CloudWatchをなぜ使うのか

  • オンプレとAWSの両方を可視化できる
  • 自動的にモニタリングできる
  • リアルタイムに問題を解決できる
  • More time back to focus on bbc innovation
  • イノベーションに集中して、より時間を使える

What's new CloudWatch

Automatic Dashboardが提供されたことで、リソースの状況を一覧できるようになった。

  • 動的にアップデートされるAWSインフラダッシュボード
  • 私の求めるダッシュボード != あなたが求めるダッシュボード

Automatic Dashboardについては、以前、弊社すずきが取り上げています。

CloudWatchのAutomatic Dashboardsにより、主要なAWSリソースの稼働状況を一覧確認できるようになりました

デモ

  • Lambdaの呼び出し回数やエラー発生回数、遅延時間などグラフ化
  • ダッシュボードから該当のCloudWatch Logsへドリルダウンで調査可能
  • Insightsからエラー発生頻度を頻度も調査可能

まとめ

  • 簡単にすべてを集約する
  • メトリクスとログを関連付ける
  • モニタリングの自動化

さいごに

本セッションは、モニタリングがなぜ必要なのか重要性を解説し、BBCのオンプレとAWSのハイブリット環境でのAmazon CloudWatchを活かしたモニタリングの事例を紹介、その後、Amazon CloudWatchの新機能を紹介するというものでした。
収集したメトリクスやログが最終的にアプリケーションに活かされ、利益を生む、Amazon CloudWatchを中心にその重要性を伝える内容でした。