Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オブザーバビリティが広げる AIOps の世界 / The World of AIOps Ex...
Search
Kento Kimura
PRO
September 04, 2025
Video
Technology
0
130
オブザーバビリティが広げる AIOps の世界 / The World of AIOps Expanded by Observability
『Boost Summer 2025 -Code Overflow-』
https://cyberagent.connpass.com/event/361830/
Kento Kimura
PRO
September 04, 2025
Tweet
Share
Video
More Decks by Kento Kimura
See All by Kento Kimura
予測から調査へ、AI エージェントで叶える AIOps の未来 / From Prediction to Investigation: The Future of AIOps with AI Agents
aoto
PRO
0
29
Datadog による AI エージェント オブザーバビリティの最前線 / The Frontlines of AI Agent Observability by Datadog
aoto
PRO
0
2
プラットフォームとしての Datadog / Datadog as Platforms
aoto
PRO
2
550
Cloud Run を解剖して コンテナ監視を考える / Breaking Down Cloud Run to Rethink Container Monitoring
aoto
PRO
0
180
もっと!スタートアップ創業期を支えるオブザーバビリティ基盤のこれまでとこれから / More! The Past and Future of Observability Platforms Supporting Early-Stage Startups
aoto
PRO
0
1
Recap of Next - Google Cloud で実践する クラウドネイティブ最前線 / The Frontlines of Cloud-Native with Insights from Google Cloud
aoto
PRO
1
150
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Observability?
aoto
PRO
0
300
元祖 AIOps! メトリクス異常検知からはじめよう 〜さようなら Lookout for Metrics〜 / The Original AIOps! Let's get started with Metrics Anomaly Detection - Good-bye Lookout for Metrics
aoto
PRO
0
260
Dive Deep in Cloud Run: Automatic Base Image update
aoto
PRO
0
1k
Other Decks in Technology
See All in Technology
人と組織に偏重したEMへのアンチテーゼ──なぜ、EMに設計力が必要なのか/An antithesis to the overemphasis of people and organizations in EM
dskst
7
810
AIエージェントの活用に重要な「MCP (Model Context Protocol)」とは何か
masayamoriofficial
0
240
LLM翻訳ツールの開発と海外のお客様対応等への社内導入事例
gree_tech
PRO
0
380
生成AI時代に必要な価値ある意思決定を育てる「開発プロセス定義」を用いた中期戦略
kakehashi
PRO
1
220
つくって納得、つかって実感! 大規模言語モデルことはじめ
recruitengineers
PRO
31
11k
「守る」から「進化させる」セキュリティへ ~AWS re:Inforce 2025参加報告~ / AWS re:Inforce 2025 Participation Report
yuj1osm
1
180
エキサイトブログの トップページを 段階的にリプレイスする
zsp2088dev
0
160
実践AIガバナンス
asei
3
250
ヒューリスティック評価を用いたゲームQA実践事例
gree_tech
PRO
0
380
AI時代に非連続な成長を実現するエンジニアリング戦略
sansantech
PRO
3
850
Browser
recruitengineers
PRO
6
2k
Microsoft Fabric のネットワーク保護のアップデートについて
ryomaru0825
1
120
Featured
See All Featured
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
284
13k
Gamification - CAS2011
davidbonilla
81
5.4k
Designing for humans not robots
tammielis
253
25k
The Art of Programming - Codeland 2020
erikaheidi
55
13k
Visualization
eitanlees
147
16k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
1.1k
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
StorybookのUI Testing Handbookを読んだ
zakiyama
30
6.1k
Mobile First: as difficult as doing things right
swwweet
224
9.9k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
570
Documentation Writing (for coders)
carmenintech
73
5k
Speed Design
sergeychernyshev
32
1.1k
Transcript
オブザーバビリティが広げる AIOps の世界 4th Sep, Boost Summer 2025 -Code Overflow-
Speaker: Kento Kimura
話すこと 01 AIOps の変遷と現在地 04 まとめと展望 03 Datadog の障害対応: AIOps
と AI エージェント 02 オブザーバビリティが解き明かす世界 話さないこと XX AI コーディングエージェントのあれこれ XX Datadog 以外の具体的な AIOps と AI エージェントの取り組み XX オブザーバビリティの基本的な概念
話すひと • 所属: Technical Solutions / Sales Engineering • 担当:
パブリッククラウドのアーキテクト知識を活かした Datadog のプリセールス技術支援 • コミュニティ: Google Cloud のユーザーコミュニティ「Jagu'e'r」 Datadog のユーザーコミュニティ「JDDUG」 AWS のユーザーコミュニティ「JAWS」 • カンファレンス: 初開催!Observability Conference Tokyo 2025 木村 健人 (Kento Kimura) Datadog Japan GK
AIOps の変遷と現在地
システムの複雑性と AIOps AIOps
AIOps の変遷と Datadog 2016年 AIOps のはじまり Gartner が「Algorithmic IT Operations」を提唱
その後「AIOps」に整理 2017-19年 AIOps の広がり 監視運用に AI を導入し、 異常検知やアラート集約の 取り組みが行われる 2020-22年 AIOps の高度化 根本原因分析や自動修復等、 発展的なアプローチが出現 クラウドや監視ツールに 機能として組み込まれ始める 2023年 LLM の登場 生成 AI、特に LLM により 従来の運用監視業務を 効率化する試みが始まる Watchdog™ Bits AI Watchdog RCA
2025年 AI エージェントの登場 特定の目的を自律的に遂行する AI エージェントの登場により、 一部のタスクを効率化する機能が 試験的に登場する “ “
“ “ AI エージェントの定義 AIOps AI エージェント 環境と対話し、データを収集し、そのデータを使用して 自己決定タスクを実行して、事前に決められた 目標を達成するためのソフトウェアプログラム AIを活用してユーザーに代わって 目標達成やタスク完了を行うソフトウェアシステム
2025年 AI エージェントの登場 特定の目的を自律的に遂行する AI エージェントの登場により、 一部のタスクを効率化する機能が 試験的に登場する 環境と対話し、データを収集し、そのデータを使用して 自己決定タスクを実行して、事前に決められた
目標を達成するためのソフトウェアプログラム AIを活用してユーザーに代わって 目標達成やタスク完了を行うソフトウェアシステム “ “ “ “ AI エージェントの定義 AIOps AI SRE エージェント
AIOps × AI エージェントの鍵 運用の「目的達成」を支援する自律的なソフトウェアシステム • 偽陽性システムアラートの抑制 • システムアラートへの対応(トリアージの実施) •
オンコールの実施と正確な情報伝達 • 障害に対する根本原因の分析 • 事後検証(ポストモーテム)の作成 • 過去の障害事例からの学習 運用の目的を達成するためには、 システム固有の情報と形式知が重要 システムの状態を把握する能力 =オブザーバビリティ が必要
DevSecOps と AI エージェント SEC Security: AI Security Operations AI
がシステムの脆弱性と脅威を診断 CI/CD: AI Code Review Operation: AIOps+α Develop: AI Coding AI でコードを生成し、AI でレビューしデプロイ AIOps を拡張?
DevSecOps と AI エージェント CI/CD: AI Code Review Operation: AIOps+α
Develop: AI Coding AI でコードを生成し、AI でレビューしデプロイ SEC AIOps を拡張? Security: AI Security Operations AI がシステムの脆弱性と脅威を診断 後半に の AI エージェントが登場
オブザーバビリティが 解き明かす世界
システムの複雑性とオブザーバビリティ Observability
コーディングエージェント AI と AI を繋ぐオブザーバビリティ コーディング テスト ビルド デプロイ 実行
運用 AIOps AI SRE エージェント AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード 「どう動くか」が わからないまま… 複雑な CI/CD の プロセスを経て…
コーディングエージェント AI と AI を繋ぐオブザーバビリティ コーディング テスト ビルド デプロイ 実行
運用 AIOps AI SRE エージェント AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード
コーディングエージェント AI と AI を繋ぐオブザーバビリティ コーディング テスト ビルド デプロイ 実行
運用 AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード システムの状態を把握するために、 各プロセスでオブザーバビリティが役立つ AIOps AI SRE エージェント + オブザーバビリティ +
Datadog の障害対応: AIOps と AI エージェント
DevSecOps と AI エージェント SEC Security: AI Security Operations AI
がシステムの脆弱性と脅威を診断 CI/CD: AI Code Review Operation: AIOps+α Develop: AI Coding AI でコードを生成し、AI でレビューしデプロイ AIOps を拡張?
SEC DevSecOps と Datadog の AI エージェント CI/CD: AI Code
Review Operation: AIOps+α Develop: AI Coding AI でコードを生成し、AI でレビューしデプロイ Security: AI Security Operations AI がシステムの脆弱性と脅威を診断 AIOps を拡張?
Datadog のインシデント管理プロセス アラート検知 トリアージ インシデント 宣言 オンコール 根本原因 分析 復旧
事後検証 セ キ ュ リ テ ィ シ ス テ ム Monitor Incident Management On-Call Workflow Automation Notebooks Security Signal Watchdog™ Watchdog RCA Remediation AI Voice Interface (Preview) AIOps AI Agent AI Agent
根本原因分析 トリアージ 自律的な調査 Bits AI SRE
Bits AI SRE Agent: トリアージ 通知されたモニターに調査結果(トリアージ)を反映し、調査時間を短縮
Bits AI SRE Agent: 自律的な調査 説明可能な形で調査内容を記録し、根本原因の仮説を検証
Bits AI SRE Agent: 根本原因分析・学習 結論から想定される原因を深掘りし、結果を学習し以降の調査を向上
プロファイル 分析 エラー分析 トレース分析 Bits AI Dev
Bits AI Dev Agent: エラー分析・コード改修 障害の原因となるエラーから、自動でコードの改修と PR の作成を提案
Bits AI Dev Agent: トレース分析・コード改修 インタラクティブにトレースを読み解き、根本原因を究明
Bits AI Dev Agent: プロファイル分析・コード改修 パフォーマンス分析をした事象から、コードの改修を依頼し PR を作成
Bits AI Agents のループ AI Voice Interface (Preview) アラートの 抑制
トリアージ オンコール 根本原因分析 事後検証 事例学習 修復
インシデント対応 テレメトリ調査 コード生成 Datadog MCP Server
まとめと展望
まとめ • AI エージェントの登場により、AIOps は貢献領域が拡大しそう • オブザーバビリティが大量のAI 生成コードと AIOps を繋ぐ架け橋に
• Datadog Bits AI Agents は DevSecOps を体現するエージェントたち 展望 • コーディングエージェントと同じく、SRE エージェントも一般的になる! • AI コーディングをする時は、オブザーバビリティの導入をお忘れなく👀 • Datadog Bits AI Agents を早く使ってほしい!
宣伝
OSAKA
OSAKA SEP 04, 2025
None
OCT 16, 2025
OCT 16, 2025
Thank you!