Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI × Incident Response: What ’s Next?
Search
kenta_hi
September 19, 2025
0
14
AI × Incident Response: What ’s Next?
Youtrust主催のHistory Confarence 2025でおこなったLTです。
https://lp-prohis.youtrust.jp/
kenta_hi
September 19, 2025
Tweet
Share
More Decks by kenta_hi
See All by kenta_hi
SREの組織類型に応じた リーダシップの考察
kenta_hi
2
930
SRE NEXT 2024 で形にした バトンを渡せる仕組み
kenta_hi
1
170
SRE活動を促進させるドキュメント技術 〜ドキュメントレビューって、どうやってる?〜
kenta_hi
1
430
SREの組織類型におけるリーダーシップの考察
kenta_hi
3
3k
SRE Lounge #14 LT
kenta_hi
0
480
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.9k
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
GitHub's CSS Performance
jonrohan
1032
460k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.5k
KATA
mclloyd
32
14k
Testing 201, or: Great Expectations
jmmastey
45
7.7k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
127
53k
GraphQLとの向き合い方2022年版
quramy
49
14k
Documentation Writing (for coders)
carmenintech
74
5k
Navigating Team Friction
lara
189
15k
Docker and Python
trallard
46
3.6k
Transcript
AI × Incident Response: What’s Next? 株式会社 Topotal / Kenta
Hishida (@kenta_hi) PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) 1
Kenta Hisihda @kenta_hi Director @ Topotal, Inc. 2 PRODUCT HISTORY
CONFERENCE 2025 | Kenta Hishida (@kenta_hi)
3 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi)
6 なぜ、AIが進化しているのに インシデント対応では 活用されてないの? PRODUCT HISTORY CONFERENCE 2025 | Kenta
Hishida (@kenta_hi)
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) なぜ、AIにインシデント対応が任せられないのか
一般的なインシデント対応のプロセスは、優先度付け、調査、診断、テスト/修 正と流れていく ※ SRE Book Chapter 12 - Effective Troubleshooting https://sre.google/sre-book/effective-troubleshooting/ インシデント対応前 Runbook、Runbook rule インシデント対応中 チャンネルの自動作成、チーム組成 ドキュメント自動生成 インシデント対応後 ポストモーテム自動生成 メトリクス収集・可視化 分析
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) なぜ、AIにインシデント対応が任せられないのか
一般的なインシデント対応のプロセスは、優先度付け、調査、診断、テスト/修 正と流れていく ※ SRE Book Chapter 12 - Effective Troubleshooting https://sre.google/sre-book/effective-troubleshooting/ インシデント対応前 Runbook、Runbook rule インシデント対応中 チャンネルの自動作成、チーム組成 ドキュメント自動生成 インシデント対応後 ポストモーテム自動生成 メトリクス収集・可視化 分析 Triage~Test/Treatの 支援はこれから
6 インシデント対応はビジネス に影響するので、AIの想定外 の振る舞いは困る PRODUCT HISTORY CONFERENCE 2025 | Kenta
Hishida (@kenta_hi)
6 ビジネス影響が限られた範囲で AIを活用すればよさそう PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida
(@kenta_hi)
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ビジネス影響が限られたものは、重大度が低いインシデント
インシデント対応のTriageで重大度を定めます。重大度に応じて対応方針が決 まっている。 ※1 : インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介 株式会社Topotal 髙村成道 https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 HIGH (P1) 大多数の顧客に対して明確に不 便を感じさせる劣化が生じてい る 迅速な対応が必要(24h365d、 15分以内着手) 該当エンジニアチームにページ ング 関連エンジニアチームのリー ダーに通知。影響を受けた顧客 へのコミュニケーションを検討 WARNING (P2) 一部の顧客に対して顧客体験の 軽度な劣化が生じている 営業時間帯に他の業務よりも優 先して対応 営業時間内のみページング 関連エンジニアチームのマネー ジャーに通知。重要顧客のみ対 応検討 INFO (P3) 顧客体験に目立った劣化がない か、非常に軽微な影響が生じて いる 通常業務と並行して勤務時間内 に対応 ページング不要 関連エンジニアチームのマネー ジャーに通知。顧客向け通知は 不要
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ※1
: インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介 株式会社Topotal 髙村成道 https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 H IGH (P1 ) 大多数の顧客に対して明確 に不 便 を感 じさせ る劣化が生じてい る 迅速 な対応が必要(24h365d、 1 5分以内 着手) 該当エ ンジニアチ ーム にページ ング 関連エ ンジニアチ ーム のリ ー ダ ーに通知。影響 を受 けた顧客 へ のコミュニケーションを検討 W ARN ING (P2 ) 一 部の顧客に対して顧客体験の 軽度 な劣化が生じている 営業 時間帯 に他 の業務よりも優 先 して対応 営業 時間内 のみ ページング 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。重要顧客のみ 対 応検討 INFO (P3 ) 顧客体験に目立っ た劣化がない か 、非常 に軽微 な影響 が生じて いる 通常業務と並行 して勤務 時間内 に対応 ページング不 要 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。顧客向け通知は 不 要 重大度の低いINFOやWARNINGに 対して、AIを活用するのが現実的 さらにAIの行動を人が承認する フローにすることで 広範囲なAIの活用が可能に AIに任せるインシデントは、ビジネス影響が少ない、重大度 の低いインシデントから
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ※1
: インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介 株式会社Topotal 髙村成道 https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 H IGH (P1 ) 大多数の顧客に対して明確 に不 便 を感 じさせ る劣化が生じてい る 迅速 な対応が必要(24h365d、 1 5分以内 着手) 該当エ ンジニアチ ーム にページ ング 関連エ ンジニアチ ーム のリ ー ダ ーに通知。影響 を受 けた顧客 へ のコミュニケーションを検討 W ARN ING (P2 ) 一 部の顧客に対して顧客体験の 軽度 な劣化が生じている 営業 時間帯 に他 の業務よりも優 先 して対応 営業 時間内 のみ ページング 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。重要顧客のみ 対 応検討 INFO (P3 ) 顧客体験に目立っ た劣化がない か 、非常 に軽微 な影響 が生じて いる 通常業務と並行 して勤務 時間内 に対応 ページング不 要 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。顧客向け通知は 不 要 近い将来、「つらい」インシデン ト対応はなくなるのではないで しょうか 重大度の低いものはよく発生する ので、AIに任せるだけでも楽にな るはずです。 AIに任せるインシデントは、ビジネス影響が少ない、重大度 の低いインシデントから
6 人とAIの協働する インシデントレスポンス(Demo) PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida
(@kenta_hi)
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) Waroom
MCP デモ ※3 https://www.youtube.com/watch?v=uydmjdv0Efs