Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オブザーバビリティが広げる AIOps の世界 / The World of AIOps Ex...
Search
Kento Kimura
PRO
September 04, 2025
Video
Technology
0
430
オブザーバビリティが広げる AIOps の世界 / The World of AIOps Expanded by Observability
『Boost Summer 2025 -Code Overflow-』
https://cyberagent.connpass.com/event/361830/
Kento Kimura
PRO
September 04, 2025
Tweet
Share
Video
More Decks by Kento Kimura
See All by Kento Kimura
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
540
予測から調査へ、AI エージェントで叶える AIOps の未来 / From Prediction to Investigation: The Future of AIOps with AI Agents
aoto
PRO
0
82
Datadog による AI エージェント オブザーバビリティの最前線 / The Frontlines of AI Agent Observability by Datadog
aoto
PRO
0
48
プラットフォームとしての Datadog / Datadog as Platforms
aoto
PRO
2
580
Cloud Run を解剖して コンテナ監視を考える / Breaking Down Cloud Run to Rethink Container Monitoring
aoto
PRO
0
200
もっと!スタートアップ創業期を支えるオブザーバビリティ基盤のこれまでとこれから / More! The Past and Future of Observability Platforms Supporting Early-Stage Startups
aoto
PRO
0
2
Recap of Next - Google Cloud で実践する クラウドネイティブ最前線 / The Frontlines of Cloud-Native with Insights from Google Cloud
aoto
PRO
1
160
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Observability?
aoto
PRO
0
310
元祖 AIOps! メトリクス異常検知からはじめよう 〜さようなら Lookout for Metrics〜 / The Original AIOps! Let's get started with Metrics Anomaly Detection - Good-bye Lookout for Metrics
aoto
PRO
0
270
Other Decks in Technology
See All in Technology
KAGのLT会 #8 - 東京リージョンでGAしたAmazon Q in QuickSightを使って、報告用の資料を作ってみた
0air
0
180
VCC 2025 Write-up
bata_24
0
140
自作LLM Native GORM Pluginで実現する AI Agentバックテスト基盤構築
po3rin
2
210
SOC2取得の全体像
shonansurvivors
1
340
20250929_QaaS_vol20
mura_shin
0
110
Function calling機能をPLaMo2に実装するには / PFN LLMセミナー
pfn
PRO
0
740
DataOpsNight#8_Terragruntを用いたスケーラブルなSnowflakeインフラ管理
roki18d
1
300
生成AIを活用したZennの取り組み事例
ryosukeigarashi
0
170
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
9k
Pythonによる契約プログラミング入門 / PyCon JP 2025
7pairs
4
2.3k
AI×Data×SaaS×Operation
sansantech
PRO
0
110
API提供者のためのMCPサーバー設計ガイド / MCP Server Design Guide for API Providers
yokawasa
0
240
Featured
See All Featured
Producing Creativity
orderedlist
PRO
347
40k
How GitHub (no longer) Works
holman
315
140k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
The Language of Interfaces
destraynor
162
25k
Speed Design
sergeychernyshev
32
1.1k
YesSQL, Process and Tooling at Scale
rocio
173
14k
What's in a price? How to price your products and services
michaelherold
246
12k
Designing for humans not robots
tammielis
254
25k
Statistics for Hackers
jakevdp
799
220k
Transcript
オブザーバビリティが広げる AIOps の世界 4th Sep, Boost Summer 2025 -Code Overflow-
Speaker: Kento Kimura
話すこと 01 AIOps の変遷と現在地 04 まとめと展望 03 Datadog の障害対応: AIOps
と AI エージェント 02 オブザーバビリティが解き明かす世界 話さないこと XX AI コーディングエージェントのあれこれ XX Datadog 以外の具体的な AIOps と AI エージェントの取り組み XX オブザーバビリティの基本的な概念
話すひと • 所属: Technical Solutions / Sales Engineering • 担当:
パブリッククラウドのアーキテクト知識を活かした Datadog のプリセールス技術支援 • コミュニティ: Google Cloud のユーザーコミュニティ「Jagu'e'r」 Datadog のユーザーコミュニティ「JDDUG」 AWS のユーザーコミュニティ「JAWS」 • カンファレンス: 初開催!Observability Conference Tokyo 2025 木村 健人 (Kento Kimura) Datadog Japan GK
AIOps の変遷と現在地
システムの複雑性と AIOps AIOps
AIOps の変遷と Datadog 2016年 AIOps のはじまり Gartner が「Algorithmic IT Operations」を提唱
その後「AIOps」に整理 2017-19年 AIOps の広がり 監視運用に AI を導入し、 異常検知やアラート集約の 取り組みが行われる 2020-22年 AIOps の高度化 根本原因分析や自動修復等、 発展的なアプローチが出現 クラウドや監視ツールに 機能として組み込まれ始める 2023年 LLM の登場 生成 AI、特に LLM により 従来の運用監視業務を 効率化する試みが始まる Watchdog™ Bits AI Watchdog RCA
2025年 AI エージェントの登場 特定の目的を自律的に遂行する AI エージェントの登場により、 一部のタスクを効率化する機能が 試験的に登場する “ “
“ “ AI エージェントの定義 AIOps AI エージェント 環境と対話し、データを収集し、そのデータを使用して 自己決定タスクを実行して、事前に決められた 目標を達成するためのソフトウェアプログラム AIを活用してユーザーに代わって 目標達成やタスク完了を行うソフトウェアシステム
2025年 AI エージェントの登場 特定の目的を自律的に遂行する AI エージェントの登場により、 一部のタスクを効率化する機能が 試験的に登場する 環境と対話し、データを収集し、そのデータを使用して 自己決定タスクを実行して、事前に決められた
目標を達成するためのソフトウェアプログラム AIを活用してユーザーに代わって 目標達成やタスク完了を行うソフトウェアシステム “ “ “ “ AI エージェントの定義 AIOps AI SRE エージェント
AIOps × AI エージェントの鍵 運用の「目的達成」を支援する自律的なソフトウェアシステム • 偽陽性システムアラートの抑制 • システムアラートへの対応(トリアージの実施) •
オンコールの実施と正確な情報伝達 • 障害に対する根本原因の分析 • 事後検証(ポストモーテム)の作成 • 過去の障害事例からの学習 運用の目的を達成するためには、 システム固有の情報と形式知が重要 システムの状態を把握する能力 =オブザーバビリティ が必要
DevSecOps と AI エージェント SEC Security: AI Security Operations AI
がシステムの脆弱性と脅威を診断 CI/CD: AI Code Review Operation: AIOps+α Develop: AI Coding AI でコードを生成し、AI でレビューしデプロイ AIOps を拡張?
DevSecOps と AI エージェント CI/CD: AI Code Review Operation: AIOps+α
Develop: AI Coding AI でコードを生成し、AI でレビューしデプロイ SEC AIOps を拡張? Security: AI Security Operations AI がシステムの脆弱性と脅威を診断 後半に の AI エージェントが登場
オブザーバビリティが 解き明かす世界
システムの複雑性とオブザーバビリティ Observability
コーディングエージェント AI と AI を繋ぐオブザーバビリティ コーディング テスト ビルド デプロイ 実行
運用 AIOps AI SRE エージェント AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード 「どう動くか」が わからないまま… 複雑な CI/CD の プロセスを経て…
コーディングエージェント AI と AI を繋ぐオブザーバビリティ コーディング テスト ビルド デプロイ 実行
運用 AIOps AI SRE エージェント AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード
コーディングエージェント AI と AI を繋ぐオブザーバビリティ コーディング テスト ビルド デプロイ 実行
運用 AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード AI 生成コード システムの状態を把握するために、 各プロセスでオブザーバビリティが役立つ AIOps AI SRE エージェント + オブザーバビリティ +
Datadog の障害対応: AIOps と AI エージェント
DevSecOps と AI エージェント SEC Security: AI Security Operations AI
がシステムの脆弱性と脅威を診断 CI/CD: AI Code Review Operation: AIOps+α Develop: AI Coding AI でコードを生成し、AI でレビューしデプロイ AIOps を拡張?
SEC DevSecOps と Datadog の AI エージェント CI/CD: AI Code
Review Operation: AIOps+α Develop: AI Coding AI でコードを生成し、AI でレビューしデプロイ Security: AI Security Operations AI がシステムの脆弱性と脅威を診断 AIOps を拡張?
Datadog のインシデント管理プロセス アラート検知 トリアージ インシデント 宣言 オンコール 根本原因 分析 復旧
事後検証 セ キ ュ リ テ ィ シ ス テ ム Monitor Incident Management On-Call Workflow Automation Notebooks Security Signal Watchdog™ Watchdog RCA Remediation AI Voice Interface (Preview) AIOps AI Agent AI Agent
根本原因分析 トリアージ 自律的な調査 Bits AI SRE
Bits AI SRE Agent: トリアージ 通知されたモニターに調査結果(トリアージ)を反映し、調査時間を短縮
Bits AI SRE Agent: 自律的な調査 説明可能な形で調査内容を記録し、根本原因の仮説を検証
Bits AI SRE Agent: 根本原因分析・学習 結論から想定される原因を深掘りし、結果を学習し以降の調査を向上
プロファイル 分析 エラー分析 トレース分析 Bits AI Dev
Bits AI Dev Agent: エラー分析・コード改修 障害の原因となるエラーから、自動でコードの改修と PR の作成を提案
Bits AI Dev Agent: トレース分析・コード改修 インタラクティブにトレースを読み解き、根本原因を究明
Bits AI Dev Agent: プロファイル分析・コード改修 パフォーマンス分析をした事象から、コードの改修を依頼し PR を作成
Bits AI Agents のループ AI Voice Interface (Preview) アラートの 抑制
トリアージ オンコール 根本原因分析 事後検証 事例学習 修復
インシデント対応 テレメトリ調査 コード生成 Datadog MCP Server
まとめと展望
まとめ • AI エージェントの登場により、AIOps は貢献領域が拡大しそう • オブザーバビリティが大量のAI 生成コードと AIOps を繋ぐ架け橋に
• Datadog Bits AI Agents は DevSecOps を体現するエージェントたち 展望 • コーディングエージェントと同じく、SRE エージェントも一般的になる! • AI コーディングをする時は、オブザーバビリティの導入をお忘れなく👀 • Datadog Bits AI Agents を早く使ってほしい!
宣伝
OSAKA
OSAKA SEP 04, 2025
None
OCT 16, 2025
OCT 16, 2025
Thank you!