Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
元祖 AIOps! メトリクス異常検知からはじめよう 〜さようなら Lookout for M...
Search
Kento Kimura
PRO
March 04, 2025
Video
Technology
320
0
Share
元祖 AIOps! メトリクス異常検知からはじめよう 〜さようなら Lookout for Metrics〜 / The Original AIOps! Let's get started with Metrics Anomaly Detection - Good-bye Lookout for Metrics
OpsJAWS Meetup #33『AIOps』
https://opsjaws.connpass.com/event/342300/
Kento Kimura
PRO
March 04, 2025
Video
More Decks by Kento Kimura
See All by Kento Kimura
Compose Spec の変遷と Cloud Run のイマ / The History of Compose Spec and Cloud Run Support
aoto
PRO
0
79
頼れる Agentic AI を支える Datadog のオブザーバビリティ / Powering Reliable Agentic AI with Datadog Observability
aoto
PRO
0
370
作りっぱなしで終わらせない! 価値を出し続ける AI エージェントのための「信頼性」設計 / Designing Reliability for AI Agents that Deliver Continuous Value
aoto
PRO
2
390
Google に学ぶ、安全性を高める信頼性設計 / Reliability Design for Enhanced Safety: Lessons from Google SRE
aoto
PRO
0
85
AI エージェントで AI エージェントを作る!Google Cloudが実現するフルスタックな AI 開発エコシステム / Building AI Agents with AI Agents! Full-Stack AI Development Ecosystem on Google Cloud
aoto
PRO
0
360
Jagu'e'r Advent Calendar でコミュニティを盛り上げよう / Join us the community with Jagu'e'r Advent Calendar
aoto
PRO
0
74
現場の壁を乗り越えて、 「計装注入」が拓く オブザーバビリティ / Beyond the Field Barriers: Instrumentation Injection and the Future of Observability
aoto
PRO
1
1.5k
「最速」で Gemini CLI を使いこなそう! 〜Cloud Shell/Cloud Run の活用〜 / The Fastest Way to Master the Gemini CLI — with Cloud Shell and Cloud Run
aoto
PRO
1
410
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
1.1k
Other Decks in Technology
See All in Technology
【技術書典20】OpenFOAM(自宅で深める流体解析)流れと熱移動(2)
kamakiri1225
0
380
そのSLO 99.9%、本当に必要ですか? 〜優先度付きSLOによる責任共有の設計思想〜 / Is that 99.9% SLO really necessary? Design philosophy of shared responsibility through prioritized SLOs
vtryo
0
450
毎日の作業を Claude Code 経由にしたら、 ノウハウがコードになった
kossykinto
1
1.2k
Vision Banana: Image Generators are Generalist Vision Learners
kzykmyzw
0
330
freeeで運用しているAIQAについて
qatonchan
0
450
SLI/SLO、「完全に理解した」から「チョットデキル」へ
maruloop
1
150
「強制アップデート」か「チームの自律」か?エンタープライズが辿り着いたプラットフォームのハイブリッド運用/cloudnative-kaigi-hybrid-platform-operations
mhrtech
0
150
[Scram Fest Niigata2026]Quality as Code〜AIにQAの思考を再現させる試み〜
masamiyajiri
1
290
100マイクロサービスのTerraform/Kubernetes管理地獄から抜け出すためのAI活用術
markie1009
0
110
Swift Sequence の便利 API 再発見
treastrain
1
230
QAエンジニアはどうやって プロダクト議論の場に入れるのか?
moritamasami
2
410
2026-05-14 要件定義からソース管理まで!IBM Bob基礎ハンズオン
yutanonaka
0
120
Featured
See All Featured
Context Engineering - Making Every Token Count
addyosmani
9
870
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
190
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
270
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
740
The Cost Of JavaScript in 2023
addyosmani
55
9.9k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
Done Done
chrislema
186
16k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.8k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Transcript
元祖 AIOps! メトリクス異常検知からはじめよう 〜さようなら Lookout for Metrics〜 4th Mar, OpsJAWS
Meetup#33 『AIOps』 Kento Kimura
自己紹介 • 所属:Technical Solutions / Sales Engineer • 担当:パブリッククラウドのアーキテクト知識を活かした Datadog
のプリセールス技術支援 • 活動: 2023 Japan AWS Jr.Champion → AWS Community Builder(Cloud Operations) JAWS-UG にたまに出没する犬のロゴの会社の人です🐶 JAWS DAYS 2025 には個人スポンサー・当日スタッフとして参加しました🦈 好きな AWS サービスは CloudWatch Application Signals 木村 健人 (Kento Kimura) Datadog Japan GK Experience データセンター運用保守 → パブリッククラウド技術支援 → プリセールス技術支援 Community JAWS-UG, Jagu'e'r, CloudNative Days
おはなし 3 01 AIOps on AWS 02 AIOps について考える 03
Lookout for Metrics と異常検知 04 これからの異常検知 05 まとめ
4 AIOps on AWS
詳しくは OpsJAWS #27『EC2の運用と監視』 5 引用「AIOpsを活用してAWS監視を体験してみた 〜EC2も監視できるよ〜」 https://speakerdeck.com/hiashisan/opsjaws27-aiops-aws
6 AIOps について考える
AIOps AIOps = Artificial Intelligence for IT Operations
AIOps のかんたんな歴史 8 2016 AIOps の概念が登場 Gartner の提唱により、 AI ×
IT Operations を 組み合わせた造語が生まれる 2020~ プラットフォームとして AIOps が提供され始める 監視プラットフォームに機能と して異常検出・パターン化・比 較機能などが備わる ~2016 IT 運用の効率化のため、 機械学習とビッグ データを利用 する試みが始まる IT 運用は大量の監視データを扱 うため、AI 活用に向いていた 2017 AIOps の普及期 AIOps の様々な手法が 活用され始める 独自の機械学習アルゴリズムを 活用してログ・メトリクスの 異常検知を行う取り組みが主流 2023~ 生成 AI を活用した AIOps が 登場する 自然言語検索・運用 AI エー ジェント・ポストモーテムの 自動生成などの取り組みが行 われる Amazon Lookout for Metrics CloudWatch Logs features CloudWatch Anomaly Detection とAWS上の異常検知
Amazon.com の技術から構築 された、時系列データ内の異 常を検出するサービス 工業製品の視覚的な欠陥を コンピューター ビジョンを使 用して発見するサービス 産業機器を監視し、機器の異 常な動作を検出し、潜在的な
障害を特定するサービス Lookout 3兄弟 9 Amazon Lookout for Equipment Amazon Lookout for Metrics Amazon Lookout for Vision 2025 年 10 月 31 日に廃止 2024 年 10 月 17 日に廃止済 (コンソールには残っている) 2025 年 9 月 12 日に廃止 (現在は新規利用不可)
Lookout for Metrics の代わりに各機能を使おう 10 CloudWatch Anomaly Detection をはじめ として、OpenSearch,
Redshift, QuickSight, Glue Data Quality, SageMaker Canvas は それぞれ異常検出(検知)の機能を持っている 監視データ転送不要で プラットフォーム上で 異常検知ができる時代!!
AWS サービス廃止からの学び 工場・産業機器を主な対象とする Vertical AI は AWS では必要無くなった? これからは Bedrock
や SageMaker で Vertical AI (Agent) が構築されていく 11
12 Lookout for Metrics と異常検知
Amazon Lookout for Metrics Lookout for Metrics の構造 13 検出器
:データセットを監視して異常を検出するリソース データソース :AWS 内外から収集できる時系列メトリクス データセット :検出器によるデータのコピー、タイムスタンプと値のフィールドを分析する メトリクス :タイムスタンプ × 値のフィールド(メジャー) 警告 :SNS や Lambda をターゲットとする通知やワークフローの実行 Datasource Metrics Amazon AppFlow Amazon S3 Amazon RDS Dataset Detector Alert COPY AWS Lambda Amazon SNS
Lookout for Metrics の良かったところ CloudWatch Anomaly Detection のように、異常検知の機能を持たない プラットフォームに自分でカスタマイズした専用の異常検知機能を用意できた🤔 14
Lookout for Metrics の良かったところと今 CloudWatch Anomaly Detection のように、異常検知の機能を持たない プラットフォームに自分でカスタマイズした専用の異常検知機能を用意できた AIOps
黎明期には様々な対象にオリジナルの異常検知に需要がありそうだった →各データセットに基づく、精度の高い異常検知ができる…? 思ったよりも AIOps の体制や機能を自分たちで作り上げることが大変で、 異常検知もそれほどさまざまなパターンが必要ではなかった →異常検知の閾値や季節・周期性の考慮とアルゴリズムの選択で十分 15
16 異常検知のモデルを一から触るより プラットフォームにある機能を そのまま使ったらいいよね
17 これからの異常検知
18 これからの異常検知 メトリクス
19 異常検知のモデルを一から触るより プラットフォームにある機能を そのまま使ったらいいよね
メトリクス異常検知に求められる要素 ① 低コストな計算: プラットフォーム側の負荷軽減や即時検知のために、 軽量なアルゴリズムを採用する ② 誤検知を減らす: 時系列メトリクスの特性に合わせて季節・周期性の考慮 閾値の設定やアルゴリズムの変更が必要 ③
組み込みの機能: 利用者が追加の運用負荷を感じることなく、 簡単に利用開始できてカスタマイズできること 20
CloudWatch Anomaly Detection (in Alarm) 21 異常検出を選ぶ 条件を選ぶ 閾値の設定
22 まとめ
まとめ • AIOps といっても、異常検知から運用 AI エージェントまでさまざま • 異常検知は様々な監視プラットフォームに組み込まれていて すぐに始められる! •
Lookout for Metrics の廃止から学んだこと: 異常検知のカスタマイズよりも、システムの改善に時間をかけよう • CloudWatch Anomaly Detection は設定も簡単 23
Thank you