Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Software Delivery Observability ~ CI・CD , DORA ...
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Annosuke Yokoo
May 16, 2025
Technology
770
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Software Delivery Observability ~ CI・CD , DORA metrics も Datadog で可視化しよう ~ / datadog-ci-cd-observability
Annosuke Yokoo
May 16, 2025
More Decks by Annosuke Yokoo
See All by Annosuke Yokoo
Bits AI SRE と Datadog MCP Server による未来 / datadog-bits-ai-sre-and-mcp-server-feature
parupappa2929
0
310
Datadog GPU Monitoring で実現する GPU 監視 / datadog-gpu-monitoring
parupappa2929
0
48
Datadog による AI エージェント オブザーバビリティの最前線 / Datadog-AI-Agent-observability
parupappa2929
1
620
今日から始める CI/CD Observability / CICD Observability for Google Cloud
parupappa2929
0
63
Helm , Kustomize に代わる !? 次世代 k8s パッケージマネージャー Glasskube 入門 / glasskube-entry
parupappa2929
0
910
持続可能なプラットフォーム目指す、Platform Engineering 支援 / Enabling Platform Engineering
parupappa2929
0
150
Why adopt GitOps with ArgoCD ?
parupappa2929
0
210
Google Cloud Next Tokyo’24 勝手にRecap コンテナ最新アップデート紹介 / google-cloud-next-recap-gke-cloud-run
parupappa2929
0
140
迅速に叶える、GKE Autopilot によるユニバーサルモダンアーキテクチャの実践/Rapidly Achieve Universal Modern Architecture with GKE Autopilot in Practice
parupappa2929
0
220
Other Decks in Technology
See All in Technology
攻撃者視点で考えるDetection Engineering
cryptopeg
3
2k
【Cyber-sec+】経営層を"動かす"ための考え方
hssh2_bin
0
200
2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算
line_developers_tw
PRO
0
1.3k
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
140
あなたの知らないPDFのアクセシビリティ
lycorptech_jp
PRO
0
220
GitHub Copilot 最新アップデート – 「一歩先」の実践活用術
moulongzhang
5
1.5k
脆弱性対応、どこで線を引くか
rymiyamoto
1
420
就職⽀援サービスにおけるキャリアアドバイザーのシフトスケジューリング
recruitengineers
PRO
1
150
iAEONの段階的リアーキテクト戦略 / iAEON's_Gradual_Re-architecture_Strategy
aeonpeople
0
230
【セミナー資料】Claude Code をセキュアに使うための考え方と設定の勘どころ / Claude Code Webinar 20260616
masahirokawahara
2
420
不要なレビューをAIにまかせて AIコーディングの環境改善を加速した
shoota
1
230
Lightning近況報告
kozy4324
0
190
Featured
See All Featured
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
430
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
Navigating Weather and Climate Data
rabernat
0
220
Joys of Absence: A Defence of Solitary Play
codingconduct
1
400
How STYLIGHT went responsive
nonsquared
100
6.2k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
390
Speed Design
sergeychernyshev
33
1.9k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
390
sira's awesome portfolio website redesign presentation
elsirapls
0
280
Transcript
Software Delivery Observability CI/CD , DORA metrics も Datadog で可視化しよう
2025/05/16 SRE Tech Talk - Annosuke Yokoo (@866mfs)
2 自己紹介 Annosuke Yokoo(横尾杏之介) Datadog - Sales Engineer X :
@866mfs Awards : Google Cloud Partner Top Engineer 2025 Fellow Community : Jagu'e'r オブザーバビリティ分科会 Oraganizer Interest : Sauna 🧖 / 🚢 / Observability 🔭 X で Datadog の最新情報を(気まぐれで)呟く Bot やってます Scan Me 👇
❏ 内容 ◦ CI/CD オブザーバビリティ ◦ DORA Metrics を CI/CD
の改善に生かそう ❏ ゴール ◦ CI/CD にもオブザーバビリティの考えを適用する ◦ Datadog にも CI/CD を中心とした Software Delivery におけるオブザー バビリティを高めるプロダクトがある 3 今日話すこと
4 “オブザーバビリティ”は運用フェーズだけではない tag-observability /whitepaper.md https://github.com/cncf/tag-observability/blob/main/whitepaper.md
5 “オブザーバビリティ”は運用フェーズだけではない tag-observability /whitepaper.md https://github.com/cncf/tag-observability/blob/main/whitepaper.md Observability(可観測性)は、システム開発ライフサイクルのあらゆる フェーズで活用することができます。 新機能のテスト中、プロダクション環境のレジリエンスの監視、顧客がどのように製品 を利用しているかのインサイト取得、あるいは製品ロードマップに関するデータ主導の 意思決定を行う際にも利用可能です。
いずれかの目的が明確になれば、次に考えるべきは 「出力」、つまり私たちが 「シグ ナル」 と呼んでいるものになります。
6 Development QA Staging Production Shifting left より開発初期段階の環境における テストとパイプラインにも可視性 (可観測性)をもたらす
これまでは Prod だけで オブザーバビリティを考える オブザーバビリティのシフトレフト
7 Development QA Staging Production Shifting left より開発初期段階の環境における テストとパイプラインにも可視性 をもたらす
これまでは Prod だけで オブザーバビリティを考える オブザーバビリティのシフトレフト “運用”だけでなく”開発”におけるオブザーバビリ ティのシフトレフトを考えることで、より生産的か つ安全にソフトウェアをデリバリーできる
8 継続的な改善には、CI/CD オブザーバビリティが重要 https://speakerdeck.com/sansantech/20250514
• プロアクティブなエラー検知 ◦ テレメトリーシグナルを活用することで、CI/CD パイプライン内のパフォーマンス劣化 や不安定な挙動をデプロイ前に検知・対処可能 • 高速なフィードバックループ ◦ パイプライン全体のトレース性と実行状況の分析により、ビルド時間のボトルネック特定
やテストの信頼性評価が可能 • ソフトウェアデリバリーの信頼性可視化 ◦ ビルド・テスト段階での健全性の把握による、リリース判断の精度向上 • トレーサビリティとインシデントの根本原因分析 ◦ コミット単位でのジョブ失敗やパフォーマンス変化の可視化により、根本原因を迅速に把 握. インシデント対応の高速化とチームの説明責任の明確化 9 CI/CD オブザーバビリティのもたらす効果
ここから Datadog の話になります 10
Datadog の CI, CD Visibility 知っている方? 11
Secure Analyze Cloud Service Management Cloud Service Management • Incident
Management • Case Management • Service Catalog • Resource Catalog • Workflow Automation • App Builder Monitor & Operate Optimize Software Delivery • RUM • RUM Heatmap/ Clickmap/ Scrollmap • Mobile App Testing • Session Replay • Cloud Security Mgmt • Application Security Mgmt • Cloud SIEM • Software Composition Analysis • Sensitive Data Scanner • Infra Monitoring • Network Monitoring • APM • Synthetics • Log Mgmt • Universal Service Monitoring • Observability Pipelines • LLM Observability • Continuous Profiler • Database Monitoring • Data Streams Monitoring • Cloud Cost Mgmt • Data Jobs Monitoring • CI Visibility • Intelligent Test Runner • Continuous Testing • Test Visibility Business Run Business Dev Monitor Operate Optimize Code Ship Test Understand Users Support Users Understand Business Run Secure 12 Datadog のオブザーバビリティ全体像
13 Datadog CI/CD Observability 全体像
14 Datadog CI/CD Observability 全体像
15 ジョブの失敗やリグレッ ションテストなどの難しい デバッグ 複雑なパイプラインによ るリリース速度/頻度の 低下 時間と共に増加する CI/CD コスト
CI/CD の実行待ちによる 生産性の無い時間 CI/CD オブザーバビリティが全く無いと...
16 CI における課題 変更差分が大きくなり、複数の Job が走る Pipeline を考える • Build
実行時間が長くなり、キャッシュでも対応できなくなってくる • 各 Step の所要時間を把握しづらい( or 出来ない) ◦ クリティカルパスの把握が難しい • 複雑な Pipeline は Job 失敗時の根本原因がわかりづらくなる → 生産性の低下 → CI の待ち時間が絶妙に何も生み出せない時間となる...(経験上) ◦ コーヒーブレイク / 雑談 / 休憩
17 CI ツールにもモニタリング View はあるけど... • 特にこだわりなく(選択肢が無いから)使っている人 も多いのでは...?
18 Continuous Integration (CI) Visibility • 内容 GA Continuous Integration
Visibility https://docs.datadoghq.com/continuous_integration/
19 Continuous Integration (CI) Visibility 各 Step の Trace を
Flame Graph で表示 • Job は並列実行されることが多いため、依存関係が明確 化 クリティカルパス(Critical Path)の特定 • 依存関係により順番に実行されるステップ • 最も長くかかる経路 Exclusive Time(排他時間) • パイプラインの完了をそのステップだけがブロックして いる時間 CI の実行時間を短縮するにはクリティカルパス上の Job の実行 時間を短縮する必要がある → ビルドキャッシュ使用 → ビルドアーティファクト / テストの再使用 → Job の並列化 / 順序変更 GA https://docs.datadoghq.com/continuous_integration/guides/identify_highest_impact_jobs_with_critical_path/ クリティカル パスを特定 Log との相関 Exclusive Time
20 CD における課題 デプロイ時に気にすべき指標は、たくさんあるが... デプロイ(CD)に関するメトリクスは意外と追いづらい😓 • なぜデプロイが失敗したのか? • サービスのデプロイに平均してどれくらい時間がかかっているのか? •
すべての環境で現在デプロイされているサービスバージョンは何か? • この Deployment でデプロイされている変更は何か? • 先週、チームでどれくらいのロールバックが発生したか? • なぜデプロイの完了にそんなに時間がかかるのか? • 通常のデプロイ実行時間と外れ値は何か? • CD パイプラインをどうすれば高速化できるか?
21 Continuous Delivery (CD) Visibility Private Beta Continuous Delivery Visibility
https://docs.datadoghq.com/continuous_delivery/
22 Continuous Delivery (CD) Visibility Private Beta Continuous Delivery Visibility
https://docs.datadoghq.com/continuous_delivery/ Demo - 実際に見てみましょう🏃
23 CI/CD オブザーバビリティのその先 • CI, CD Visibility により、これまで見えにくかった部分を(簡単に)改善できる ◦ 単発の改善ではなく、フィードバックループを築き、継続的改善につなげること
• CI/CD の継続的改善により、開発生産性を向上させることができる ↔ 開発生産性向上のために CI/CD の継続的改善がある • とはいえ、開発生産性 と一言で表すのは抽象度が高い • 改善と効果測定(計測)はセットでないといけない → なので、DORA Metrics もセットで考えましょう
24 そもそも DORA って ? • Google にある1部門 (2018年に買収) ◦ DevOps
Research and Assessment • DevOps の業界動向を調査する組織 • DevOps 界隈のベンチマークレポート「State of DevOps Report(SODR)」が有名 ◦ DevOpsパフォーマンスモデルの提供 ◦ 開発生産性向上に関する多くの事例やレポート ◦ 開発生産性を計測するための4つの指標(Metrics)を提唱
25 そもそも DORA って? • Google にある1部門 (2018年に買収) ◦ DevOps Research
and Assessment • DevOps の業界動向を調査する組織 • DevOps 界隈のベンチマークレポート「State of DevOps Report(SODR)」が有名 ◦ DevOpsパフォーマンスモデルの提供 ◦ 開発生産性向上に関する多くの事例やレポート ◦ 開発生産性を計測するための4つの指標(Metrics)を提唱 Four Keys 🔑 Four Keys だけでは少し古くなってきている... 開発生産性を計測する上では、+ 信頼性(SLA, SLI, SLO) も重要な指標
26 ç Lead time for changes Deployment Frequency Time to
restore service Change failure rate (Datadog では) Four Keys = DORA Metrics デプロイ頻度 変更リードタイム 変更失敗率 MTTR
27 What Are DORA Metrics? https://www.datadoghq.com/knowledge-center/dora-metrics/
28 DORA Metrics Preview DORA Metrics https://docs.datadoghq.com/dora_metrics/
29 DORA Metrics Preview https://docs.datadoghq.com/dora_metrics/data_collected/#change-lead-time-metrics
• すでに周知の事実だが、DORA Metrics は”ハック”が出来てしまう ◦ 特に”デプロイ頻度”は細かくコミットを刻んでリリースすれば良いだけ • DORA Metrics の取得は手段であって、目的ではない
◦ DORA Metrics を取得して得られた、改善のきっかけ(洞察)にこそ価値がある • 改善のきっかけは、(CI/CD) オブザーバビリティを通して可視化できる ◦ デプロイ頻度が少ない → Rollback の影響が測れていないため変更が大きくなる ◦ 変更リードタイムが長い → CI/CD のクリティカルパスを特定できていない ◦ 変更失敗率が高い → CI のトレースが出来ていないので、根本原因が不明 ◦ MRRT が長い → そもそもオブザーバビリティ全体が足りていない可能性 30 DORA Metrics を CI/CD オブザーバビリティに活用する
❏ 話した内容 ◦ CI/CD オブザーバビリティも(当たり前のように)考えようというお話し ◦ DORA Metrics は手段であり目的ではない ❏
ゴール ◦ CI/CD にもオブザーバビリティの考えを適用する → 継続的な改善には開発フェーズにもオブザーバビリティを使う (オブザーバビリティのシフトレフト) ◦ Datadog にも CI/CD を中心とした Software Delivery におけるオブザーバビリ ティを高めるプロダクトがある → CI, CD Visibility, DORA Metrics 31 まとめ
32 宣伝 - Datadog Live Tokyo 👆Scan Now👆
Thank you!