Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Obs...
Search
Kento Kimura
PRO
March 18, 2025
Video
Technology
0
230
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Observability?
JAWS SRE #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
https://jawsug-sre.connpass.com/event/346434/
Kento Kimura
PRO
March 18, 2025
Tweet
Share
Video
More Decks by Kento Kimura
See All by Kento Kimura
Recap of Next - Google Cloud で実践する クラウドネイティブ最前線 / The Frontlines of Cloud-Native with Insights from Google Cloud
aoto
PRO
1
100
元祖 AIOps! メトリクス異常検知からはじめよう 〜さようなら Lookout for Metrics〜 / The Original AIOps! Let's get started with Metrics Anomaly Detection - Good-bye Lookout for Metrics
aoto
PRO
0
220
Dive Deep in Cloud Run: Automatic Base Image update
aoto
PRO
0
990
CloudWatch Application Signals と APM の入門 / Introduction to CloudWatch Application Signals and ApM
aoto
PRO
2
1.4k
Recap『Platform Engineering 入門: Golden Path の構築と活用』
aoto
PRO
0
1k
Two different ways to export AWS CloudWatch Metrics
aoto
PRO
0
1.1k
オブザーバビリティの再考
aoto
PRO
0
920
コンテナで Datadog APM をはじめよう
aoto
PRO
0
1.3k
分散トレースを理解する! Trace Context 解体新書 / Understanding Distributed Tracing! Trace Context Tabul Anatomic
aoto
PRO
6
4k
Other Decks in Technology
See All in Technology
OSSコントリビュートをphp-srcメンテナの立場から語る / OSS Contribute
sakitakamachi
0
1.4k
AWSの新機能検証をやる時こそ、Amazon Qでプロンプトエンジニアリングを駆使しよう
duelist2020jp
1
150
大AI時代で輝くために今こそドメインにディープダイブしよう / Deep Dive into Domain in AI-Agent-Era
yuitosato
1
360
AI Agentを「期待通り」に動かすために:設計アプローチの模索と現在地
kworkdev
PRO
2
440
アジャイル脅威モデリング#1(脅威モデリングナイト#8)
masakane55
3
190
AIコーディングの最前線 〜活用のコツと課題〜
pharma_x_tech
1
870
4/17/25 - CIJUG - Java Meets AI: Build LLM-Powered Apps with LangChain4j (part 2)
edeandrea
PRO
0
100
AWSのマルチアカウント管理 ベストプラクティス最新版 2025 / Multi-Account management on AWS best practice 2025
ohmura
4
280
Devinで模索する AIファースト開発〜ゼロベースから始めるDevOpsの進化〜
potix2
PRO
7
3.3k
Linuxのパッケージ管理とアップデート基礎知識
go_nishimoto
0
110
20250411_HCCJP_AdaptiveCloudUpdates.pdf
sdosamut
1
110
SmartHR プロダクトエンジニア求人ガイド_2025 / PdE job guide 2025
smarthr
0
100
Featured
See All Featured
How GitHub (no longer) Works
holman
314
140k
It's Worth the Effort
3n
184
28k
Testing 201, or: Great Expectations
jmmastey
42
7.5k
Code Review Best Practice
trishagee
67
18k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
47
2.5k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.1k
How to train your dragon (web standard)
notwaldorf
90
6k
Documentation Writing (for coders)
carmenintech
69
4.7k
For a Future-Friendly Web
brad_frost
176
9.7k
Optimising Largest Contentful Paint
csswizardry
36
3.2k
Building Applications with DynamoDB
mza
94
6.3k
Transcript
AWS で広がる オブザーバビリティの世界 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』 Kento Kimura
SRE は AWS オブザーバビリティの 夢を見るか?🐏 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
Kento Kimura
• 所属:Technical Solutions / Sales Engineer • 担当:パブリッククラウドのアーキテクト知識を活かした Datadog のプリセールス技術支援
• 活動: 2023 Japan AWS Jr.Champion → AWS Community Builder(Cloud Operations) JAWS-UG にたまに出没する犬のロゴの会社の人です🐶 JAWS DAYS 2025 には個人スポンサー・当日スタッフとして参加しました🦈 好きな AWS サービスは CloudWatch Application Signals 木村 健人 (Kento Kimura) Datadog Japan GK Experience データセンター運用保守 → パブリッククラウド技術支援 → プリセールス技術支援 Community JAWS-UG, Jagu'e'r, CloudNative Days あなたは誰?
おはなし 4 01 オブザーバビリティってなんだっけ? 02 オブザーバビリティ in AWS 03 re:Invent
2024 でどう変わった? 04 AWS Observability の夢をみる 05 まとめ
5 オブザーバビリティって なんだっけ?
6 SRE にとって オブザーバビリティって なんだっけ?
7 SRE and AWS 引用『サイト信頼性エンジニアリングと Amazon Web Services / SRE
and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws
Dickerson の信頼性階層(SRE のプラクティス) 8 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
Dickerson の信頼性階層(SRE のプラクティス) 9 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
10 監視・オブザーバビリティは SRE プラクティスの入り口
11 オブザーバビリティ =「システムがその出力から 内部状態を推測できる状態」
12 オブザーバビリティ =「システムの状態(いつ・どこで・ 何が起こっているか)がわかる」
13 オブザーバビリティ in AWS
SRE のプラクティスと AWS サービス 14 参考『サイト信頼性エンジニアリングと Amazon Web Services /
SRE and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws?slide=24 UX 開発 キャパシティ計画 テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ Amazon CloudWatch Amazon Managed Grafana Amazon Managed Service for Prometheus AWS Distro for OpenTelemetry AWS X-Ray
15 オブザーバビリティ in AWS 引用『オブザーバビリティの観点でみる AWS』https://speakerdeck.com/ymotongpoo/aws-from-observability-perspective
CloudWatch のサービス群 16 Alarm RUM Logs Data protection Logs Synthetics
Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 17 Alarm RUM Event Evidently Logs
Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 18 Alarm RUM Logs Event Evidently
Metrics Logs Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch Traces
Logs Deprecated/Retired Events Insights Application Metrics Network Inform CloudWatch のサービス群
19 Alarm RUM Event Evidently Logs Data protection Visualize Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Traces Amazon CloudWatch
20 re: Invent 2024 で どう変わった?
たくさんのアップデート 21
たくさんのアップデート 22 で、何が変わったの? 🤔🤔🤔🤔🤔
何が変わったのか 23 ①マップを用いた可視化 ②監視データの検索性 ③トレースの強化
①マップを用いた可視化 24 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
①マップを用いた可視化 25 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
②監視データの検索性 26 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
②監視データの検索性 27 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
③トレースの強化 28 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
③トレースの強化 29 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
30 AWS オブザーバビリティ の 夢を見る
オブザーバビリティで大事なこと クラウドネイティブ技術の標準化を推進する Cloud Native Computing Foundation が提唱 する、Observability Whitepaper では、メトリクス・トレース・ログをはじめとする
監視データを相関させることの重要性が言及されています 31
オブザーバビリティの夢🐏 32 ①監視データの紐付き ②同一の検索性
問題が起きていそうな AWS リソースを見つける メトリクス・ログ・トレースの 検索に同じクエリや 直感的な操作ができる リソースに紐づく 監視データや 監視データに紐づく 別の監視データを確認する
オブザーバビリティの夢🐏 33
34 まとめ
まとめ • re: Invent 2024 で追加された CloudWatch のアップデートは オブザーバビリティの理想系に近づくための変化 •
新しく実装をしなくても、Operational troubleshooting のように CloudWatch コンソール自体も進化している • AWS でもトレースデータが扱いやすくなっていて、 分散トレースや APM を始めるチャンス! (Application Signals, ADOT に入門しましょう!) 35
Thank you