](https://images.ctfassets.net/ct0aopd36mqt/545yz8YCuTICrExgjAVcya/aefd7665232e9fccd1c828e92f5006e3/aws-summit-japan2026_session_e.png?w=3840&fm=webp)
【セッションレポート】 なぜあなたの運用は AI で楽にならないのか (sponsored by PagerDuty) [PRT211-S](PagerDuty 草間氏)
こんにちは
Summit でもらったクッションが帰りの新幹線で役立ちました。
運用イノベーション部のかわいです。
楽しかった AWS Summit も大盛況のまま終幕し、セッションアーカイブも公開されましたね。
廻れなかったセッションは少しずつ視聴していこうと思います。
さて、今回は PagerDuty 草間氏のセッションについてレポートしたいと思います(紹介許可いただきました。ありがとうございます)。
DevOps Agent をはじめとした AI エージェントを使った運用も本番環境で使われるようになってきている昨今ですが、はたして人間の負荷は下がっているのか?について疑問を投げかけるセッションで、すごく鋭い視点をもってらっしゃるなと感じながら聴講しました。

セッションについて
セッションタイトル:なぜあなたの運用は AI で楽にならないのか
セッションスピーカー:Kusama Kazuto 氏, Product Evangelist, PagerDuty
AI によりコードを書く速度もデプロイの頻度も上がりました。しかし運用面ではどうでしょう?ひとたびシステム障害が起きると現場は即混乱、あまり楽になっていません。AI は個人の生産性を上げますが、システム障害の影響は組織全体に及びます。この範囲のミスマッチが、運用がラクにならない理由です。本セッションでは、PagerDuty を活用しながら組織として障害に向き合うための実践的アプローチをご紹介します。
セッションの概要
- 生成 AI が台頭したことによる開発の民主化に伴い、運用がボトルネックに
- 近年のインシデントの多くがディプロイ時や本番apply時
- AI が関与できない、物理的な部分の適切な仕組み化が大事
セッションの内容
2025年は AI エージェント元年
2025年から現在にかけて、生成 AI によって業務やタスクの進め方、チーム体制までもが大きく変革した。
誰でも開発に参画できるようになり(いわゆる開発の民主化)、これによってアプリが量産できるように。
そのうえで、運用が新たなボトルネックとして浮き彫りになります。


あえて誇張して表現されていましたが、これには後述する背景が十分に含まれています。

運用がボトルネックに
この根拠として、
- 開発の民主化によって開発に携わる人数は増えたが、ディプロイ時や本番apply時等、本番環境でのインシデントが増加
- 運用がボトルネックに
- コードレビューは人からAIへ→早く出して観測し、より早く切り戻す時代に
- 見える化は大事だけど、障害はなくならない
これらを前提として、以下の例が提示されます。

(すごいリアル)
- はたして発生しているのは「インシデント」だけなのか?(ハード的な意味合い)
- 障害発生時、各ステークホルダーごとの不安を取り除く必要がある
- AI が関わっていない部分がボトルネックになっている
との問題提起。

ステークホルダーごとに問題視している部分が違うため、それぞれのペインを理解しておく必要がある。

インシデントを「管理」することが重要
なので、AIじゃない部分のインシデント管理が必要となる。


まずは基本をしっかりおさえましょう。
- オブザーバビリティ
- インシデント対応プロセス構築
- 情報共有と連絡手段

体制とコミュニケーションのお話
「初心者サッカー」のようなインシデント対応をやめよう、というお話。
→ ひとつのボール(インシデント)に集まるのではなく、役割分担が大事
適切な粒度で、適切な方法で、適切なタイミングで。

基本的には左図のインシデントコマンダ(司令塔)を置き、意思決定者を配置するのがおすすめ。
各自は「メトリクス確認」「ログ確認」「アプリ側の確認」などに、細かく分担する。

コンセンサスを取る
コンセンサスを取るのは難しいというお話。
(なので、先ほどのインシデントコマンダを置きましょう、に繋がる)
例として「ダウンタイムを許容し再起動を行う」のか「解消まで長時間待つ」のか?
二者択一に迫られる、かつ短時間で選択を迫られる場面。

ここで、聴講者向けに質問がありました。
「この背景は青ですか?」

「・・・」
会場は沈黙でした。
聴講者は100名程度でしょうか?いたのですが、これと同様のことがインシデント発生時の社内でも起こり得ます。
私含め、「どう反応していいか、どう回答したらいいか」分からなかったのが本質です。
この問題への回答は
「何か強い反対意見はありますか?」
でした。

この投げかけだと「賛成であれば反応しなくて良い」ことになります。
すごく効率的かつ、短時間で意見を引き出すことができます。
インシデント対応プロセスを確立しよう
インシデント対応プロセスとして、仕組み化が大切
- 相手のわかる粒度で説明
- 影響範囲・いつ治るのか?
- 定時報告・中間報告

また、インシデント対応時に使用可能な運用ノウハウが、下記「Ops Guide」で公開されています(オープンソース)。
AI エージェント時代こそ、振り返りをしよう
マインスイーパを使った面白い例↓

結局 AI エージェントにマインスイーパを攻略させても、左下部分の運要素がからむ箇所は人間に委ねられる、という指摘。
なので、インシデントが発生したら、分析と改善をしていきましょう、というお話。

PagerDuty 社では、システム運用ライフサイクルを構築できる製品を提供されているとのことでした。

まとめ
生成 AI により運用面も自動化が謳われる時代になりましたが、システムやアプリケーションの裏にはたくさんの人が介在している点を、あらためて認識できる良いセッションでした。
私自身も新しい技術に飛びつく前に、このシステムの運用ってインシデント発生時のフローはどうなってたっけ?といった問題提起を忘れないことが大事だと感じました。
完









