Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Datadog による 自己完結的アプリケーションモニタリング
Search
Recruit
PRO
March 13, 2024
Technology
6
1.6k
Datadog による 自己完結的アプリケーションモニタリング
2024/03/13に、Japan Datadog User Group Meetup#3で発表した、小檜山の資料です。
Recruit
PRO
March 13, 2024
Tweet
Share
More Decks by Recruit
See All by Recruit
Javaで作る RAGを活用した Q&Aアプリケーション
recruitengineers
PRO
1
100
問題解決に役立つ数理工学
recruitengineers
PRO
11
2.8k
Curiosity & Persistence
recruitengineers
PRO
2
190
結果的にこうなった。から見える メカニズムのようなもの。
recruitengineers
PRO
1
410
成長実感と伸び悩みからふりかえる キャリアグラフ
recruitengineers
PRO
1
180
リクルートの オンプレ環境の未来を語る
recruitengineers
PRO
3
340
LLMのプロダクト装着と独自モデル開発
recruitengineers
PRO
1
350
新規検索基盤でマッチング精度向上に挑む! ~『ホットペッパーグルメ』の開発事例 ビジネス編
recruitengineers
PRO
3
190
新規検索基盤でマッチング精度向上に挑む! ~『ホットペッパーグルメ』の開発事例 技術編
recruitengineers
PRO
2
250
Other Decks in Technology
See All in Technology
AWS アーキテクチャ作図入門/aws-architecture-diagram-101
ma2shita
29
10k
AWS Summit Japan 2025 Community Stage - App workflow automation by AWS Step Functions
matsuihidetoshi
1
220
Agentic DevOps時代の生存戦略
kkamegawa
1
1.3k
実践! AIエージェント導入記
1mono2prod
0
150
Liquid Glass革新とSwiftUI/UIKit進化
fumiyasac0921
0
170
PHP開発者のためのSOLID原則再入門 #phpcon / PHP Conference Japan 2025
shogogg
4
640
監視のこれまでとこれから/sakura monitoring seminar 2025
fujiwara3
11
3.8k
解析の定理証明実践@Lean 4
dec9ue
0
170
Snowflake Summit 2025 データエンジニアリング関連新機能紹介 / Snowflake Summit 2025 What's New about Data Engineering
tiltmax3
0
300
MySQL5.6から8.4へ 戦いの記録
kyoshidaxx
1
170
BrainPadプログラミングコンテスト記念LT会2025_社内イベント&問題解説
brainpadpr
1
160
Welcome to the LLM Club
koic
0
160
Featured
See All Featured
Scaling GitHub
holman
459
140k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Thoughts on Productivity
jonyablonski
69
4.7k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.3k
The Pragmatic Product Professional
lauravandoore
35
6.7k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
16
940
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.5k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
The World Runs on Bad Software
bkeepers
PRO
69
11k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
930
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.4k
Transcript
#JDDUG Datadog による自己完結的アプリケーションモニタリング Datadog による 自己完結的アプリケーションモニタリング @mopp Japan Datadog User
Group Meetup#3
#JDDUG Datadog による自己完結的アプリケーションモニタリング Agenda | 00 01 03 04 About
me & us 自己完結的アプリケーションモニタリング Datadog 活用事例 まとめ
#JDDUG Datadog による自己完結的アプリケーションモニタリング About mopp • ミッション ◦ 技術的負債の解消 •
エディタ ◦ NeoVim • 好きな言語 ◦ C, Erlang/OTP • 最近ハマっていること ◦ 玉ねぎを飴色にすること
#JDDUG Datadog による自己完結的アプリケーションモニタリング About スタディサプリ 小中高 様々なスタディサプリの内 小中高向けのスタディサプリの お話をします
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリング 01
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的とは? 必要なものを必要なときに自分たちで用意できること
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的とは? • 弊組織の SRE により推進されています • 具体的には、設計、実装、QA、デプロイ、監視などの全てを
一貫してチームで行うこと • 今日は「監視」のための Datadog 利用事例を紹介します
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングとは? • チームで ◦ 問題なく動作しているか?を知ることができる ◦ メトリクスやグラフなどを必要なときに追加できる
◦ 異常を即座に検知できる • 監視が出来ているってなに? ◦ 何が、どこで、どのくらい起きているか、を知ることができる
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために こういうこと、ありがちですよね? 「要件も6割くらいが完了して順調だな〜 そろそろ Dashboard でも作ろうかな」
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために Dashboard は初期から作ろう
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために • 監視はアプリケーションと一緒に作っていこう ◦ 犬と共に歩んでください • そのために監視設定もタスクに入れてしまう
◦ Sprint Planning や Task Refinement で入れてしまう ◦ PR で一緒に追加、レビューで指摘する
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために • 監視も一緒に作るための Code - Test -
Monitor ステップ ◦ Code ▪ プロダクションコードとテストコードを書く ◦ Test ▪ 実際にアプリケーションを起動して動作確認する ◦ Monitor 🆕 ▪ 監視項目を追加する
#JDDUG Datadog による自己完結的アプリケーションモニタリング Datadog 活用事例 02
#JDDUG Datadog による自己完結的アプリケーションモニタリング 弊組織での Datadog 普及の道のり • Dashboard から利用が始まる •
SLO という概念の導入が推進される ◦ 各サービスに Monitor と SLO が設定される • APM が導入&推進される • 有識者が Notebook を使いこなし便利過ぎるとじわじわ話題に ※mopp 視点なので事実と異なる可能性があります
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard を使い込む • Datadog の基本は Dashboard だと考えています
◦ 日頃一番見るから ◦ 他の機能と連携するとより便利になるから ▪ SLO, Monitor, APM, Events など ◦ 何かあったときに見に行くから
#JDDUG Datadog による自己完結的アプリケーションモニタリング 使い込むために毎日見る • Daily Meeting で見てます ◦ 10分かからないくらい
• 異変を早めに検知するため ◦ 日頃の負荷の肌感をつけるため • Dashboard の土地勘をつけるため
#JDDUG Datadog による自己完結的アプリケーションモニタリング 使い込むために毎日見る • Kubernetes、SaaS、ドメイン固有の ものまで一つの Dashboard で見る ◦
ここを見ればこのサービスの 状態全てがわかる、が理想 • サービス1個につき1個の Dashboard ◦ 今は3つのサービスを見ている ◦ 4個以上だと大変なので 総合 Dashboard が欲しいかも
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: Percentile は基本 • p99, p90,
p50, avg あたりは基本なので見ましょう ◦ avg だけだとかなり当てにならない
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: しきい値を表示する • 例: t系なので CPU使用率が
20% を超えるなら見直しが必要 • Monitor でアラートするのも便利
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: 使用料金も見る • 最近、SRE によりAWS利用料金がサービス単位で可視化されました ◦
「うちらのサービス、思ったより高くね…?」となり改善に繋がる Text Widget で 説明が書いてあるのも易しくてよき 実は Powerpack 化されているので コピペですぐに使えて保守も簡単
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: 時間がないので箇条書き • Events のリストを表示する ◦
Kubernetes の Readiness Probe 失敗や OOM を見ている • Metrics Summary で何が表示できるか?を流し見する ◦ これ見たほうがいいかも、って案外なる ◦ Document のチェックも忘れずに • Pod数が多い CPU, Memory の使用量はヒートマップが便利
#JDDUG Datadog による自己完結的アプリケーションモニタリング custom metrics でバグ調査 • バグの調査に利用 if is_piyo_mismatch
# おかしいときの条件 tags = { user_id:, piyo_id:, platform:, browser:, version: } statsd.increment('hoge_namespace.piyo_mismatch.count', tags:) end • どのような状態か、頻度、発生時刻、などが Dashboard だと見やすい • たまにしか起きないバグ どのようなデータ分布なのかを調べたいとき、に便利 • NOTE: tags の組み合わせ数で課金されるので user_id を安直に入れるのは注意 ◦ 組織のメトリクス数が無限に増加し、請求に問題が発生します。
#JDDUG Datadog による自己完結的アプリケーションモニタリング monitor から Slack への通知 • サービスごとに専用の通知チャンネルを作成 ◦
チームだとサービス移譲のときに大変だし、混じって見づらい • 本番とそれ以外で分離 ◦ #hoge-service-prod-notifications ◦ #hoge-service-develop-notifications ◦ 初手のトリアージに便利 • チームにメンションをする ◦ IDを取るのが高難易度業務
#JDDUG Datadog による自己完結的アプリケーションモニタリング 培った Dashboard 力で調査する Notebook • グラフ弄りとメモ書きが同時にできる ◦
最高便利 • 共同編集もできる
#JDDUG Datadog による自己完結的アプリケーションモニタリング まとめ 03
#JDDUG Datadog による自己完結的アプリケーションモニタリング まとめ • 自分たちのアプリケーションは自分たちで手綱を握ろう • Code - Test
- Monitor で監視も共に育てよう • まずは Dashboard から使い尽くそう
#JDDUG Datadog による自己完結的アプリケーションモニタリング ご清聴ありがとうございました