[レポート] PagerDuty Japan Community Meetup Vol.2 #pagerduty

2024/3/5に開催された「PagerDuty Japan Community Meetup Vol.2」のレポート記事です。
2024.03.06

あしざわです。

2024/3/5に開催されたPagerDuty Japan Community Meetup Vol.2をオンラインで視聴しました。

本記事は、視聴したセッションのレポート記事です。

YouTubeアーカイブ動画

セッション① PagerDutyを活用したオンコール運用の軌跡(ココナラ編)

登壇者

株式会社ココナラ Yuta Kawasaki 氏 (@yuta_k0911)

登壇資料

セッション3行まとめ

  • ココナラでは2016年にMTTA(平均確認時間)の改善を目的にPagerDutyを導入し、結果的に改善できたという事例セッション。
  • PagerDuty導入の効果を最大化するために、主にSlack通知を利用してオンコール体制の理解促進・リマインダーの自動化・アラート対応の効率化を行った。結果、MTTAは1分未満まで(当初の10分の1)に短縮した。
  • 今後のPagerDutyに日本語ドキュメントの拡充、日本コミュニティの盛り上がり、機械学習を利用したオンコール対応の効率化を期待している。代替製品は他にないと思うので、使ったことない方はまずはPoCから使ってみてほしい。

感想

オンコール対応に悩んでいる方、PagerDutyを使い始めようとしている方に、まずはじめに見てほしいセッションだなと思いました。

セッションの冒頭で述べられていたように、PagerDuty初学者向けの資料になるように意識されたそうです。

ユーザーやアウトプットを増やして、コミュニティの活性化や活用事例を拡大させていきたいというユーザー目線の意気込みが感じられてとても良かったです。

ちなみに、PagerDuty Advent Calendar 2023でPagerDuty賞を受賞されたZennの記事が登壇のきっかけになったそうです。こちらの資料もわかりやすかったです。

セッション② PagerDuty AIOpsのご紹介

登壇者

PagerDuty株式会社 Tomoyuki Fujino 氏

セッション4行まとめ

  • PagerDutyのAIOps機能は「①ノイズ削減」「②コンテキスト提示」「③トイル削減(イベントドリブンの自動化)」に分類される。注目されがちなノイズ削減だけでなく その少し先までサポートされている。
  • AIによるアラートのグルーピング機能により、類似のアラートが自動でグループ化される。既存の顧客環境の実績から大体50%〜60%のアラートがグループ化される。
  • Integrationではなくメール経由で受け取った通知でも、Event Orchestration機能を利用してメタデータを付与することでインシデントの自動復旧が実装できる。
  • 直近30日間に発生したイベントの発生頻度によるタグの付与(Frequent / Rare / abnomaly)、直近の変更履歴の掲示、過去の類似のインシデントの表示など、過去のインシデントをインプットにしてさまざまな機能がある

感想

PagerDutyのAIOps機能について、よくある質問に対するQ&A形式で紹介されるセッションでした。

私自身の認識としてもAIOps機能といえば「ノイズ削減」というイメージがあったので、その他の機能についても手を動かして確認してみたいなと思いました。

特に心に残っているのは以下の図で、AIOps機能について振り返ったり紹介するときに使っていきたい図だな、と思いました。

紹介されたAIOps各機能について事前に収録された動画ベースのデモで紹介されていてわかりやすかったです。この辺りはぜひ動画で見てもらいたいです!

セッション③

登壇者

PagerDuty株式会社 Kazuto Kusama 氏(@jacopen

セッション3行まとめ

  • インシデント対応時はユーザー・監視ツール・他チームなどあらゆるな方向からの対応しなければならないため、AIとインシデント対応は相性がいい。
  • インシデント対応は、二次被害を起こさない・運用担当の健康・ナレッジの蓄積など制約を意識しながら最速の解決を目指すべき。AIにはCopilotというよりはCo-Driver的な動きが大事。
  • PagerDuty Copilotは「インシデントの情報をソースとしたSlack上での自然言語による応答」「ステークホルダー向けのステータスアップデートの自動生成」「ポストモーテムレポートの自動生成」のような機能が含まれており、まさにCo-Driver的な働きをする。

感想

インシデントコマンダーとしての鉄火場を経験したことはない私でも、なんとなく共感できる以下のワードから始まるセッションでした

  • AIとインシデント対応が相性がいい
  • インシデント対応時にAIに求める動きは「Co-Driver」である(Copilotではない)

(※画像はラリーにおけるCo-Driverのイメージ)

本セッションの大半を占めるPagerDuty Copilotのデモは、個人的にPagerDutyユーザーとChatOps的な活動を行ってる方は必見だなと思いました。

「インシデント内容に関する自然言語による自動応答」「ポストモーテムレポートの自動作成」などインシデント対応の未来にあってほしい夢が詰まっています。

文字だけでは何言ってるかわからないと思うのでデモをぜひ見てほしいです。

最後に

本記事ではオンラインで視聴したPagerDuty Japan Community Meetup Vol.2のセッションレポートをまとめました。

当日は都合が合わず、ライブで観られなかったのですが次回は現地参戦してみたいです。

このレポートを見て内容が気になった方はぜひYoutubeのアーカイブ動画をご覧ください!

以上です。