【小ネタ】メンテナンス中は Mackerel 監視でダウンタイム設定を行うべき理由 #mackerelio

2019.10.25

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちわ ttaka です。

既に弊社ブログでも取り上げられた Mackerel のダウンタイム設定についてですが、10/23(水)に開催された Mackerel Drink Up #9 Tokyo で発表されたダウンタイム機能の内容を聴いて「あーそれわかる、メンテナンス中はダウンタイム設定すべきだわ!!」という思いが込み上げたので紹介したいと思います。

想定する読者

  • Mackerel でシステムを監視している人
  • メンテナンス中にダウンタイムを使わず通知停止をしている人

記事を書こうと思ったきっかけ

ダウンタイム設定をすることでアラートログが停止されるから!!

ダウンタイム設定がリリースされる以前もチャンネル設定などから監視の通知を停止することは可能でした。そのため、定期メンテナンスなどアラートが発生することが予めわかっており、かつサービス影響がないことが自明であれば終了時間を指定して監視通知を停止することができました。

ただし、監視通知の停止だとアラートログには出力されてしまうため、アラート画面の一覧には表示されてしまいます。そのため、定期的に発生したアラートの振り返り( 絶対やってますよね? )を行う際に、メンテナンス起因のアラートで埋め尽くされてしまうと実際のアラート情報が埋もれてしまうため、アラートログを停止してあげるのがよいです。

どういうことか?

監視通知停止のみだと、例えばメンテナンス中に何度も Apache 再起動した影響でアラート情報がログに残ります。今回はホスト 1 台の 1 監視項目のみですが、メンテナンス影響によるアラート情報が大量に残っていたら、アラート情報は絞り込みが出来るとはいえ現状時間での絞り込みが出来ないため最悪目 grep に頼ることになって嫌ですよね。しかも、障害の前兆となるアラート情報を見逃してしまったとなったら……

最後に

ただでさえ気が重いアラートの振り返りで、メンテナンス起因のアラートが大量に出力されてげんなりしたことを思い出して思わず筆(?)を取ってしまいました。アラートの振り返りは定期的にやりましょうね!!

この記事がだれかのお役に立てば幸いです。

参考