Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Alert on Call with LLM
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Sashimimochi
December 21, 2025
Technology
1
62
Alert on Call with LLM
エンジニア達の「完全に理解した」Talk #71 で登壇したときのスライドです。
https://easy2.connpass.com/event/374169/
Sashimimochi
December 21, 2025
Tweet
Share
More Decks by Sashimimochi
See All by Sashimimochi
MCPでつなぐElasticsearchとLLM - 深夜の障害対応を楽にしたい / Bridging Elasticsearch and LLMs with MCP
sashimimochi
0
190
My AI Copilot for writing
sashimimochi
1
200
GraphRAG: What I Thought I Knew (But Didn’t)
sashimimochi
1
680
Search Engineer diving into Kubernetes
sashimimochi
1
240
Using GPTs from Local by Dify
sashimimochi
1
870
Max out Local LLM in Challenging Environments
sashimimochi
3
560
Search Engine for Frontend Engineer
sashimimochi
0
240
Start Vector Search with Solr
sashimimochi
1
1.2k
Other Decks in Technology
See All in Technology
Oracle Cloud Observability and Management Platform - OCI 運用監視サービス概要 -
oracle4engineer
PRO
2
14k
22nd ACRi Webinar - ChipTip Technology Eric-san's slide
nao_sumikawa
0
110
Generative UI を試そう!A2-UIでAIエージェントにダッシュボードを作らせてみた
kamoshika
0
110
デザインもAIに任せる!iPhoneで行うiOS開発
zozotech
PRO
0
180
Codex 5.3 と Opus 4.6 にコーポレートサイトを作らせてみた / Codex 5.3 vs Opus 4.6
ama_ch
0
250
SREチームをどう作り、どう育てるか ― Findy横断SREのマネジメント
rvirus0817
0
440
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
"共通化"と"Embed"のブレンドでスケール可能な運用を!M&Aを支えるGENDA SREの実践 / GENDA Tech Talk #3
genda
0
130
AI駆動開発を事業のコアに置く
tasukuonizawa
1
1.4k
pool.ntp.orgに ⾃宅サーバーで 参加してみたら...
tanyorg
1
2.6k
データの整合性を保ちたいだけなんだ
shoheimitani
8
3.2k
こんなところでも(地味に)活躍するImage Modeさんを知ってるかい?- Image Mode for OpenShift -
tsukaman
1
250
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Abbi's Birthday
coloredviolet
1
4.8k
Believing is Seeing
oripsolob
1
63
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
0
440
The Invisible Side of Design
smashingmag
302
51k
SEO for Brand Visibility & Recognition
aleyda
0
4.3k
How GitHub (no longer) Works
holman
316
140k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
340
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
180
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
420
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
50k
Transcript
LLMは障害対応のお友達 さしみもち 2025/11/25【オンライン】エンジニア達の「完全に理解した」Talk#71
自己紹介 さしみもち @Sashimimochi343 検索技術とその応用をこよなく愛する エンジニア。ようやくバックエンドエ ンジニア一本で名乗れるように。 最近は、GitHub Copilot Agentに個人 リポジトリのPR書かせまくっている。
2
技術書典19で新刊出しました!! https://techbookfest.org/product/66gJ3xvWVQKPufbR18GFZF 深夜のアラート対応で、過去の類似障害を探すためにクエ リを書き直し、Notionを検索し、Slackの履歴を漁 る―SREや運用エンジニアなら誰もが経験する「検索疲 れ」。本書は、そんな日常を変える一冊です。 - エラーログを見せるだけで、過去の類似障害と対処法を 自動で調べてくれる -
自然言語で質問すれば、ログとナレッジベースを横断し て回答してくれる - アラート対応のたびに、情報が自動的に集約される そんな未来が、もう手の届くところまで来ています。 3
深夜3時の悪夢 4 深夜3時、一通の電話で叩き起こされた。 眠い目をこすりながら画面を見ると、 「Production API - High Error Rate
Alert」の文字。心臓がドキッと跳ねる。 慌ててベッドから飛び起きたあなたは、 ノートPCを開き、Grafanaのダッシュボー ドを確認する。警告を知らせる真っ赤なパ ネルが目に飛び込んできた。 Slackには「スココッ」とひっきりなしに 通知が来ている。一体何が起こっている?
深夜3時の悪夢 5 ログを確認すると、見覚えのあるようなな いような文言が並んでいる。Slackでやり とりした履歴がないか、 「error」 「timeout」で検索する。 30分後にようやく類似事象を社外のテック ブログで見つける。当時の対応を確認する と、
「DBのコネクションプール枯渇。設 定値を調整して解決」と書いてある。願い を込めて、同じ対応を実施。するとエラー 率は下がり、アラートも解除。 事故報告などを済ませてほっと息をついた ときにはもう朝の5時だった。疲れ果てて 沈むように布団に戻るのだった。
深夜3時の悪夢 6 翌朝(というか数時間後)、チームのポスト モーテム会議で先輩が言う。 「あー、それ俺も半年前に対応したわ。 Notionに書いたんだけどな」 先輩よ、あなたが電話に出てくれれば一瞬 で解決したのに......。 こういう経験1度はあるのでは ないでしょうか?
こうなってほしい 7 私たちはあくまでAIに雑に聞 くだけ。 情報収集はAIくんが良しなに やってくれる世界。 こうなれば新人でも臆せず、 オンコールローテーションに 参加できるはず!
できちゃいました 8
できちゃった様子 9
できちゃった様子 10
できちゃった様子 11
できちゃった様子 12
システム全体像 13
システム全体像 14 肝はMCPサーバーの登場
MCPサーバーとは 15 Anthropic社が2024年11月に発表したオープンな通信プロトコル LLMと外部ツールを標準的な方法で接続するための標準規格 • LLMの種類によってアプリケーションの実装を変える必要がない • LLMにシステムの存在を周知し、統一フォーマットでの仕様書提供 • LLMの利用可能な機能を制御(例:/_searchのみ提供して削除を防止)
• I/OをJSON Schemaで明示 検索エンジンのクエリを自分で考えなくて良くなった!
今回の例は一例にすぎない 16 MCPサーバーの登場によっ て、既存のサービスを組み合 わせて、新サービスを作りや すくなった!!
再掲)技術書典19で新刊出しました!! https://techbookfest.org/product/66gJ3xvWVQKPufbR18GFZF 第1章:SREの現場とログ課題 第2章:Elasticsearchで始める障害ログ検 索基礎 第3章:ハイブリッド検索で「類似障害」を 見つける 第4章:MCPサーバー経由でElasticsearch にアクセスする 第5章:自然言語でアラート分析を実現する
17
まとめ 18 • 情報が分散している状態で緊急性を求められる作業はつらい • チャットで雑に聞くだけでログと原因調査と手順を調べてく れるような仕組みが作れた!! • MCPサーバー/AIエージェントの登場によってクエリを考えな くて良くなったし、インターフェースを1か所に統合できるよ
うになった • MCPサーバーは既存サービスをつなげて新しい体験価値を素 早く試せるツール
復旧作業までAIにやらせるのか 19 結局深夜に起こされるのは変わらないんだ... • 判断が予めできているかつ定形作業はやらせても良いと 思う(すでにやってる) • 都度判断が必要な本番サーバーの状態を変化させる操作 は抵抗感がある(SRE関連の勉強会でも出た意見) とある読者様の感想
使用させていただいた素材 20 • いらすとや https://www.irasutoya.com/