資料公開 Ops JAWS Meetup#21 に「システム運用アンチパターン のすすめ」というタイトルで登壇しました #OpsJAWS

2022.06.21

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは。
ご機嫌いかがでしょうか。
"No human labor is no human error" が大好きな吉井 亮です。

2022年6月21日開催 Ops JAWS Meetup#21 に「システム運用アンチパターン のすすめ」というタイトルで登壇しました。
その際に投影した資料を公開します。

資料

サマリー

CAMS

  • Culture (文化)
  • Automation (自動化)
  • Metrics (メトリクス)
  • Share (共有)

承認の自動化

ゲートキーパーとの摩擦を避け、承認を本来の目的に戻すためには自動化が有効です。
承認の自動化をするとしても承認自体の目的は果たすようにしましょう。

運用の自動化

  • 自動化による改善を行いましょう
  • 自動化を文化にしましょう
  • リスクごとの自動化を行いましょう

組織の文化

「企業文化は戦略に勝る」(ピーター・ドラッカー)

開発・運用役割の変化

開発
→ 自分たちが書いたコードが本番環境でどのように動くか詳細に理解

運用
→ プロダクトの挙動を詳細に理解

ポストモーテム

  • 良いポストモーテム
    • 非難がない
    • プロセスの問題
    • インシデントの全容解明が目的
  • アクションアイテムの定義
  • ポストモーテムのドキュメント化

アラートに疲れない

  • アラート基準
    • Runbook を含める
    • 次の行動が可能
    • オンコールローテーション
    • 精神的、肉体的負担への考慮
    • 金銭的補償
    • 代休
    • 在宅対応

情報のため込み

  • 意図的なため込み
  • 意図しないため込み

以上、吉井 亮 がお届けしました。