Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
opsmethod第1回_アラート調査の自動化にむけて
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
OKU/YAMATO
February 23, 2026
Technology
1
400
opsmethod第1回_アラート調査の自動化にむけて
2026年2月13日(金)に開催されたopsmethodの登壇資料
OKU/YAMATO
February 23, 2026
Tweet
Share
More Decks by OKU/YAMATO
See All by OKU/YAMATO
DevelopersIO2025Osaka_システムの運用監視の効率をAIを使って上げる
yamatook
2
660
Other Decks in Technology
See All in Technology
Databricks Appsで実現する社内向けAIアプリ開発の効率化
r_miura
0
150
FASTでAIエージェントを作りまくろう!
yukiogawa
4
170
AI時代のオンプレ-クラウドキャリアチェンジ考
yuu0w0yuu
0
650
ADK + Gemini Enterprise で 外部 API 連携エージェント作るなら OAuth の仕組みを理解しておこう
kaz1437
0
240
SaaSの操作主体は人間からAIへ - 経理AIエージェントが目指す深い自動化
nishihira
0
120
サイボウズ 開発本部採用ピッチ / Cybozu Engineer Recruit
cybozuinsideout
PRO
10
77k
「AIエージェントで変わる開発プロセス―レビューボトルネックからの脱却」
lycorptech_jp
PRO
0
200
Tour of Agent Protocols: MCP, A2A, AG-UI, A2UI with ADK
meteatamel
0
150
PostgreSQL 18のNOT ENFORCEDな制約とDEFERRABLEの関係
yahonda
0
150
私がよく使うMCPサーバー3選と社内で安全に活用する方法
kintotechdev
0
140
Bill One 開発エンジニア 紹介資料
sansan33
PRO
5
18k
Oracle Cloud Infrastructure(OCI):Onboarding Session(はじめてのOCI/Oracle Supportご利⽤ガイド)
oracle4engineer
PRO
2
17k
Featured
See All Featured
Deep Space Network (abreviated)
tonyrice
0
97
Designing Experiences People Love
moore
143
24k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.5k
What's in a price? How to price your products and services
michaelherold
247
13k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.8k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
200
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Crafting Experiences
bethany
1
97
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
320
Transcript
アラート調査の⾃動化にむけて ~ システム異常の調査を⾃動化した知⾒を共有したい ~ クラスメソッドオペレーションズ株式会社 クラウド運⽤チーム 奥井 ⼤和
Name → 奥井 大和 ( Okui Yamato ) 所属: クラスメソッド
オペレーションズ株式会社 クラウド運用チーム 主な業務: お客様のAWS環境の運用・保守 日々のアラート対応と障害調査 最近買って良かったもの: パネルヒーター 足元を温めてQOLの向上 自己紹介
本日のアジェンダ 1 定義:アラート調査の自動化とは 2 プロセス: どこから自動化するか? 3 アプローチ: やってみた結果
「アラート調査の自動化」とは? システム異常の通知を受け、その根本原因を特 定する作業 調査・判断をAIに任せる 「調査の初動と情報収集」を 爆速に効率化したい :アラート調査 :自動化の目標 調査の図
スコープ: 原因特定の効率化 STEP 1 監視ツールが異常検知 STEP 2 アラート通知 (メールやSlack等) STEP
3 調査 (ここを自動化したい) STEP 4 改善対応 (修復や予防などのアクション) 本件で目指すところ アラート起点の調査の STEP
"毎回似たプロセスで調査していないか? 対象環境やリソースが違うだけで、 やることは同じなのでは?" 仮説:調査のアクションをロジックは共通 「何をしたいか」さえ明確に指示すれば、 AIに任せられる。 なぜ自動化しようと思ったか、経緯
調査のプロセスを分解してみる 調査対象は違っても、やることは定型的 結果の記録・次のアクション 1 最初の状況確認と判断 (サービス停止?影響範囲?) 2 対象の特定 (ID確認、構成把握) 3
情報収集 (メトリクス、ログ、CloudTrail) 4 分析・原因の切り分け (しきい値判定、相関分析) 5 関連する影響の確認 (同システムの他サービスへの波及) 6 STEP 3 今日は トリアージ と呼ばせて
通知から全自動 通知 ➡ [AIが調査・分析・報告 ] ➡ 完了 トリアージの 後から自動 通知
➡ [人間が判断 ] ➡ [AIが調査 開始] ➡ 完了 部分的にAI利用 [人間] ➡ [AIでログ要約 ] ➡ [人間] ➡ ... 自動化の起点はどこにする? A B C 主要な3パターン
👉 全自動が正解とは限らない。目的に合わせて選択する。 項目 A: 全自動 B: トリアージ後 C: 部分的 速度
最速 数分のロス 遅い 精度 誤検知リスク 人間が要否判断 都度判断 導入コスト 高い (構築など) 中程度 低い 環境影響 システム変更あり 最小限 なし 各パターンの比較
私は「B: トリアージ後から自動」を選択 理由:最適なバランス 「サービスが止まっているか」「ユーザー影響はあるか」の重大な判断は人間が担いたい 対象さえ特定できれば、その後の情報収集や分析はロジックで回せる 既存のAWS環境にAIエージェント等の追加コンポーネントを導入せず、 今ある権限内で完結でき、環境に依存しない
✅ :既存環境に変更ゼロ / ReadOnlyで安全 実装構成 1. 人間: アラート情報をプロンプトに貼る 2. Claude
Code: 自動調査を開始 (アカウントのIAMには読み取り権限を 許可) 3. フォールバック: 権限不足時は 「追加調査手順書」 を生成 • リソース特定・メトリクス取得 • ログ分析・相関関係チェック • レポート生成
実際の調査フロー テキストファイル & 対話ベースの指示 1. プロンプトやファイルの準備 アラート通知内容をファイルにペースト 2. Claude Code
実行 ターミナルで調査開始コマンドを実行 AIが `aws cloudwatch ...` 等をCLIを自律的に実行し情報を収集 3. 成果物の生成 調査結果をまとめたレポートが出力される AWSのMCPの活用により、エビデンスも自動で取得
導入成果 以前の調査時間 導入後の調査時間 1日 所要時間 1時間 調査範囲 属人的 網羅的で高パフォーマンス
向き合い方 新たな課題と向き合い方 AI は「優秀な相方」として扱う 権限のトレードオフ 精度の限界 設定コスト IAMは読み取り権限に 絞っているため AI
だけで 完結しない。 セキュリティとのバランスとして 割り切る。 仮説が的外れなこともある。 手放しにせず、 人間がコンソールで 裏取り確認を行う。 プロンプトや機能の 定義に工数がかかる。 しかしプロセス言語化の 投資対効果は高い。 課題
まとめ:調査の自動化を実現するポイント プロセスの分解 調査は定型的。 プロセスを言語化する! 起点を選ぶ 全自動にこだわらず 目的に合わせて、どこから AIに任せるか決める 小さく始める 目星がつくだけで
調査は速くなり 効率化できる!
ご清聴ありがとうございました https://dev.classmethod.jp/author/okui-yamato/