Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ツールを超えた「共通言語」へ 開発とSREがDatadogを囲んで信頼を育てる 継続的かつ地道な実践
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
M-Yamashita
February 26, 2026
Technology
0
170
ツールを超えた「共通言語」へ 開発とSREがDatadogを囲んで信頼を育てる 継続的かつ地道な実践
Japan Datadog User Group Meetup#16@福岡 での登壇スライドです。
https://datadog-jp.connpass.com/event/378193/
M-Yamashita
February 26, 2026
Tweet
Share
More Decks by M-Yamashita
See All by M-Yamashita
アクセスピークを制するオートスケール再設計: 障害を乗り越えKEDAで実現したリソース管理の最適化
myamashii
3
2.9k
継続的な活動で築く地方エンジニアの道
myamashii
2
730
テストの高速化と品質保証の第一歩 GitHub ActionsとRSpecの基本入門
myamashii
1
680
Contributionとカンファレンス登壇への 背中を押して頂いた方々へ
myamashii
1
2k
はてなブログ作成から投稿までをGitHub Actionsで自動化する
myamashii
3
1.3k
GitHub ActionsでZennの記事を限定公開する
myamashii
3
1k
Webサービス開発者としてスタートしてからOSS Contributionまでの道のり
myamashii
0
830
Fukuoka.rb 2020年度活動報告
myamashii
0
850
OSS Contributionから感じたこと
myamashii
0
450
Other Decks in Technology
See All in Technology
マルチプレーンGPUネットワークを実現するシャッフルアーキテクチャの整理と考察
markunet
2
250
【Oracle Cloud ウェビナー】【入門編】はじめてのOracle AI Data Platform - AIのためのデータ準備&自社用AIエージェントをワンストップで実現
oracle4engineer
PRO
1
120
わからなくて良いなら、わからなきゃだめなの?
kotaoue
1
360
PMとしての意思決定とAI活用状況について
lycorptech_jp
PRO
0
130
スクリプトの先へ!AIエージェントと組み合わせる モバイルE2Eテスト
error96num
0
180
Claude Code Skills 勉強会 (DevelersIO向けに調整済み) / claude code skills for devio
masahirokawahara
1
21k
20260311 ビジネスSWG活動報告(デジタルアイデンティティ人材育成推進WG Ph2 活動報告会)
oidfj
0
330
AI時代の「本当の」ハイブリッドクラウド — エージェントが実現した、あの頃の夢
ebibibi
0
120
AI時代のSaaSとETL
shoe116
1
150
プラットフォームエンジニアリングはAI時代の開発者をどう救うのか
jacopen
5
3k
身体を持ったパーソナルAIエージェントの 可能性を探る開発
yokomachi
1
120
Claude Code 2026年 最新アップデート
oikon48
13
10k
Featured
See All Featured
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
290
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
120
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
180
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
150
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
76
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
730
Exploring anti-patterns in Rails
aemeredith
2
290
Unsuck your backbone
ammeep
672
58k
Faster Mobile Websites
deanohume
310
31k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
130
Transcript
ツールを超えた「共通言語」へ 開発とSREがDatadogを囲んで信頼を育てる 継続的かつ地道な実践
自己紹介 山下 雅人 クラウド経費・クラウド債務支払 SRE チーム バックエンドエンジニアとSREの 経験を活かして活動中 Kaigi on
Rails Organizer
今日お伝えしたいこと 「完璧なダッシュボード」より、まず「全員で見る場」を作ろう ツールは会話のきっかけ。グラフの向こうを言語化して共有する
オンプレミスからAWSへの移行 マネーフォワードの各プロダクトは オンプレミス環境で稼働していた 会社の方針により各プロダクトが AWS環境へ順次移行となった https://xtech.nikkei.com/atcl/nxt/column/18/000 01/11142/
Datadogダッシュボードの再編 オンプレ時代からダッシュボードが運用されていたが、 構成はオンプレミス前提となっていた AWS移行後はEKS・RDS・S3など見るべき対象が変わるので そのままでは何が起きているか掴めない クラウド経費・クラウド債務支払それぞれに対して再編に着手
Datadogのメトリクス可視化が手動から自動に 「見ようとしたもの」から「見えるもの」へ オンプレ時代:設定した箇所しか見えない(手動で仕込む) AWS時代:連携するだけで詳細まで可視化(自動で取れる) 手動から自動に変わったメリット 高品質・高解像度の情報が、連携するだけで自動的にアップ される 個別に仕込んでいた詳細が即座に可視化されるようになった
各メトリクスをDatadogで可視化 各マネージドサービスのメトリクスをDatadogで一元管理
簡単に追加できる点は良かったが... SREだけでは全容の把握が困難になってきた
徐々に長くなるダッシュボード サービスの成長と共に見るべき メトリクスが増加 インシデント対応で必要な メトリクスの追加も増える 結果として、ダッシュボードへの 「継ぎ足し」が続く SREだけで全容の把握は困難 ⬇︎ Still
continues...
そこで効果を発揮した取り組みが 「インフラヘルスチェック会」
インフラヘルスチェック会とは オンプレミス時代からの習慣 週1回、開発チームとSREでミーティングを実施 目的 インフラの現状の認識合わせとオーナーシップ醸成 開発者がサーバーを「自分たちのもの」として意識する
インフラヘルスチェック会がもたらしたもの Datadogの各メトリクスと 開発側コンテキストの 照らし合わせ 開発とSRE双方で 過去や未来の変更情報共有 再編による「情報量」× 既存の「会話」→「情報の交差点」
「情報の交差点」から生まれるもの SREの視点(メトリクス)と開発の視点(コード/仕様)が 頻繁に行き交う グラフと原因を結びつける翻訳が繰り返される 継続的な場の開催と会話により、グラフを見るだけで全員が 同じ理解になる Datadogが開発とSREの「共通言語」として機能するようになる
ヘルスチェック会で培った「共通言語」は 週1回の会議を超えて広がり、 有事や改善の場でも効果を発揮する
活用事例1:インシデント対応(有事) 障害発生時の動き 開発者やSREが同じ画面を見て 障害の鎮火に向けて行動 迷わない初動 「どこを見ればいいか」が明確 「いつものグラフね」という 共通認識で説明のコストがゼロ
活用事例2:開発のパフォーマンス評価(改善) リリース前の見積もりとリリース後のモニタリング 新機能リリース前に、開発とSREでメモリ増加量や 負荷傾向を把握 リリース後のモニタリングでのフィードバック 開発コードの改善における意思決定 複数処理を「まとめるか・分けるか」の判断に、Datadogの メトリクスを活用 「過去のリソース使用傾向」と「改善後の変化」を比較し 根拠を持って意思決定した
Datadogを活用した改善はまだまだ継続中 ダッシュボード 分離やシンプル化も進めつつ、 今の優先順位は開発側との 認識合わせ 使い方の共有 Slack上で各メンバーが 「こんな使い方・見方がある」 といった共有を実施
結論:Datadogという共通言語 同じ画面を見て、同じ認識を持つ 「今何が起きているか」 「次に何をすべきか」を 開発とSREの共通言語で揃える 今日持ち帰ってほしいこと i. 「完璧なダッシュボード」より、まずは「全員で見る場」を 作ろう ii.
ツールは「会話のきっかけ」 。グラフの向こうにある意図や 状況を言語化して共有する
ありがとうございました