Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Obs...
Search
Kento Kimura
PRO
March 18, 2025
Video
Technology
380
0
Share
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Observability?
JAWS SRE #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
https://jawsug-sre.connpass.com/event/346434/
Kento Kimura
PRO
March 18, 2025
Video
More Decks by Kento Kimura
See All by Kento Kimura
Compose Spec の変遷と Cloud Run のイマ / The History of Compose Spec and Cloud Run Support
aoto
PRO
0
72
頼れる Agentic AI を支える Datadog のオブザーバビリティ / Powering Reliable Agentic AI with Datadog Observability
aoto
PRO
0
340
作りっぱなしで終わらせない! 価値を出し続ける AI エージェントのための「信頼性」設計 / Designing Reliability for AI Agents that Deliver Continuous Value
aoto
PRO
2
360
Google に学ぶ、安全性を高める信頼性設計 / Reliability Design for Enhanced Safety: Lessons from Google SRE
aoto
PRO
0
76
AI エージェントで AI エージェントを作る!Google Cloudが実現するフルスタックな AI 開発エコシステム / Building AI Agents with AI Agents! Full-Stack AI Development Ecosystem on Google Cloud
aoto
PRO
0
340
Jagu'e'r Advent Calendar でコミュニティを盛り上げよう / Join us the community with Jagu'e'r Advent Calendar
aoto
PRO
0
67
現場の壁を乗り越えて、 「計装注入」が拓く オブザーバビリティ / Beyond the Field Barriers: Instrumentation Injection and the Future of Observability
aoto
PRO
1
1.4k
「最速」で Gemini CLI を使いこなそう! 〜Cloud Shell/Cloud Run の活用〜 / The Fastest Way to Master the Gemini CLI — with Cloud Shell and Cloud Run
aoto
PRO
1
380
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
1k
Other Decks in Technology
See All in Technology
AI와 협업하는 조직으로의 여정
arawn
0
110
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1.1k
こんなアーキテクチャ図はいやだ / Anti-pattern in AWS Architecture Diagrams
naospon
1
430
Master Dataグループ紹介資料
sansan33
PRO
1
4.6k
昔はシンプルだった_AmazonS3
kawaji_scratch
0
320
マルチエージェント × ハーネスエンジニアリング × GitLab Duo Agent Platformで実現する「AIエージェントに仕事をさせる時代へ。」 / 20260421 GitLab Duo Agent Platform
n11sh1
0
140
ネットワーク運用を楽にするAWS DevOps Agent活用法!! / 20260421 Masaki Okuda
shift_evolve
PRO
2
200
え!?初参加で 300冊以上 も頒布!? これは大成功!そのはずなのに わいの財布は 赤字 の件
hellohazime
0
160
Standards et agents IA : un tour d’horizon de MCP, A2A, ADK et plus encore
glaforge
0
140
「責任あるAIエージェント」こそ自社で開発しよう!
minorun365
9
1.8k
自分のハンドルは自分で握れ! ― 自分のケイパビリティを増やし、メンバーのケイパビリティ獲得を支援する ― / Take the wheel yourself
takaking22
1
860
Azure Static Web Apps の自動ビルドがタイムアウトしやすくなった状況に対応した件/global-azure2026
thara0402
0
380
Featured
See All Featured
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
100
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Producing Creativity
orderedlist
PRO
348
40k
Practical Orchestrator
shlominoach
191
11k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.4k
Typedesign – Prime Four
hannesfritz
42
3k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
480
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.2k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Navigating Team Friction
lara
192
16k
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Transcript
AWS で広がる オブザーバビリティの世界 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』 Kento Kimura
SRE は AWS オブザーバビリティの 夢を見るか?🐏 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
Kento Kimura
• 所属:Technical Solutions / Sales Engineer • 担当:パブリッククラウドのアーキテクト知識を活かした Datadog のプリセールス技術支援
• 活動: 2023 Japan AWS Jr.Champion → AWS Community Builder(Cloud Operations) JAWS-UG にたまに出没する犬のロゴの会社の人です🐶 JAWS DAYS 2025 には個人スポンサー・当日スタッフとして参加しました🦈 好きな AWS サービスは CloudWatch Application Signals 木村 健人 (Kento Kimura) Datadog Japan GK Experience データセンター運用保守 → パブリッククラウド技術支援 → プリセールス技術支援 Community JAWS-UG, Jagu'e'r, CloudNative Days あなたは誰?
おはなし 4 01 オブザーバビリティってなんだっけ? 02 オブザーバビリティ in AWS 03 re:Invent
2024 でどう変わった? 04 AWS Observability の夢をみる 05 まとめ
5 オブザーバビリティって なんだっけ?
6 SRE にとって オブザーバビリティって なんだっけ?
7 SRE and AWS 引用『サイト信頼性エンジニアリングと Amazon Web Services / SRE
and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws
Dickerson の信頼性階層(SRE のプラクティス) 8 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
Dickerson の信頼性階層(SRE のプラクティス) 9 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
10 監視・オブザーバビリティは SRE プラクティスの入り口
11 オブザーバビリティ =「システムがその出力から 内部状態を推測できる状態」
12 オブザーバビリティ =「システムの状態(いつ・どこで・ 何が起こっているか)がわかる」
13 オブザーバビリティ in AWS
SRE のプラクティスと AWS サービス 14 参考『サイト信頼性エンジニアリングと Amazon Web Services /
SRE and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws?slide=24 UX 開発 キャパシティ計画 テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ Amazon CloudWatch Amazon Managed Grafana Amazon Managed Service for Prometheus AWS Distro for OpenTelemetry AWS X-Ray
15 オブザーバビリティ in AWS 引用『オブザーバビリティの観点でみる AWS』https://speakerdeck.com/ymotongpoo/aws-from-observability-perspective
CloudWatch のサービス群 16 Alarm RUM Logs Data protection Logs Synthetics
Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 17 Alarm RUM Event Evidently Logs
Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 18 Alarm RUM Logs Event Evidently
Metrics Logs Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch Traces
Logs Deprecated/Retired Events Insights Application Metrics Network Inform CloudWatch のサービス群
19 Alarm RUM Event Evidently Logs Data protection Visualize Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Traces Amazon CloudWatch
20 re: Invent 2024 で どう変わった?
たくさんのアップデート 21
たくさんのアップデート 22 で、何が変わったの? 🤔🤔🤔🤔🤔
何が変わったのか 23 ①マップを用いた可視化 ②監視データの検索性 ③トレースの強化
①マップを用いた可視化 24 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
①マップを用いた可視化 25 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
②監視データの検索性 26 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
②監視データの検索性 27 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
③トレースの強化 28 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
③トレースの強化 29 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
30 AWS オブザーバビリティ の 夢を見る
オブザーバビリティで大事なこと クラウドネイティブ技術の標準化を推進する Cloud Native Computing Foundation が提唱 する、Observability Whitepaper では、メトリクス・トレース・ログをはじめとする
監視データを相関させることの重要性が言及されています 31
オブザーバビリティの夢🐏 32 ①監視データの紐付き ②同一の検索性
問題が起きていそうな AWS リソースを見つける メトリクス・ログ・トレースの 検索に同じクエリや 直感的な操作ができる リソースに紐づく 監視データや 監視データに紐づく 別の監視データを確認する
オブザーバビリティの夢🐏 33
34 まとめ
まとめ • re: Invent 2024 で追加された CloudWatch のアップデートは オブザーバビリティの理想系に近づくための変化 •
新しく実装をしなくても、Operational troubleshooting のように CloudWatch コンソール自体も進化している • AWS でもトレースデータが扱いやすくなっていて、 分散トレースや APM を始めるチャンス! (Application Signals, ADOT に入門しましょう!) 35
Thank you