Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
はじめてのDatadog
Search
KairiM
May 31, 2026
Technology
300
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
はじめてのDatadog
JDDUG琉球での登壇資料です
KairiM
May 31, 2026
More Decks by KairiM
See All by KairiM
エラーバジェットのアラートのタイミングを考える.pdf
kairim0
0
140
Other Decks in Technology
See All in Technology
AAIFに入ってみた ~内から見えるコミュニティ動向~
sato4
0
190
FinOps × AIエージェントで実現する コストインシデントの自動調査
oasis1994liveforever
0
130
手塩にかけりゃいいってもんじゃない
ming_ayami
0
550
プロダクト開発から業務改善コンサルまで。事業全体へ「染み出す」ことで広がるエンジニアの可能性
ham0215
0
120
エンジニアリング戦略の作り方 / Crafting Engineering Strategy
iwashi86
21
6.8k
NAB Show 2026 動画技術関連レポート / NAB Show 2026 Report
cyberagentdevelopers
PRO
0
190
ルールやカスタム機能、どう活かす?ハンズオンで体感するIBM Bobの出力コントロール
muehara
1
150
中期計画、2回作ってみた ~業務委託と正社員、両方の視点から~
demaecan
1
730
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.5k
社内 AI エージェント Synapse と セマンティックレイヤーの育て方
hiroakis
3
1.8k
【NRUG vol.18】なぜ多くのオブザーバビリティ導入は失敗するのか
nrug_member
0
120
日本 Fintech 未来予測レポート 2027〜2028年(オリジナル版)
8maki
0
2.1k
Featured
See All Featured
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
Code Reviewing Like a Champion
maltzj
528
40k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
270
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.5k
Making the Leap to Tech Lead
cromwellryan
135
9.9k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
62
44k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.4k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
210
Transcript
はじめてのDatadog AI開発とオブザーバビリティ 1
丸山 海理 所属 役職 出身地 出身校 趣味 好きなAWS サービス SNS
(株)サンエー 情報システム部 課長 京都府 琉球大学 法文学部 経済 スポーツ観戦(サッカー/野球) KIRO cli @KairiM0kinawa 2
基幹システムを内製開発 技術スタック 2026 Main Architecture Layers Design & Frontend API &
Backend Database & Auth Data Analytics Infrastructure DevEx & Observability AI-Driven-DX Quality &Tools Ops & Collab 3
すべてのプログラムを コントロール出来ていますか? 迫る期限、品質の担保、予算や技術の課題。バイ ブで生まれたブラックボックスのコード。実際の 開発現場ではすべてのプログラムを完璧な状態に保 つのはなかなか難しい。 4
品質の低下 → チームの疲弊・・・ 解決できない 4XX / 5XX エラー・・・ 突然のレイテンシー悪化・・・ UI/UXに関するクレーム・・
未知の未知・・ 5
Datadog で解決しよう!! オブザーバビリティツールであるDatadogを活用し 正しく・素早く問題を解決。ユーザー体験を良く して信頼性を勝ち取ろう!! 6
Datadog を使うモチベーション Serverless Architecture 今までのようにサーバーのCPUやメモ リの使用量、ロードアベレージだけで は問題解決に至らない・・・ Multi Account or
Cloud 大量のアカウントをまたいで、ログを 見に行くのは大変。マルチクラウドな らなおさら・・・ 運用負荷軽減 もちろん左記をOSSで対応することは 可能かもだが・・・一定の技術力が必 要。またOSSの運用負荷もある。 7
オブザーバビリティとは? 観測可能性とは、システムの外部出力に関する知 識から、その内部状態をどの程度正確に推測でき るかを示す尺度である 出典:CNCF Observability White Paper https://github.com/cncf/tag-observability/blob/main/whitepaper.md#what-is-observability System
Output Metrics Logs Traces Profiles infer 内部を推測 8
Datadog APM(Application Performance Monitoring) 9
↑様々なタグで フィルタリング ←Tracesの情報は Flame Graph や Waterfallな ど様々な見方が可能 Lambdaのコールドスタート 等も把握
←MetricsやLogsもタブの切替 だけで一元管理 10
APMで見れるもの・出来ること ↓Profiles では関数内のどの処理がメモリを使っているかまで把握 11
これからは、Bits アシスタントに聞くだけでいいかも ↓かなりの精度でAIが質問に答えてくれる 12
再現不可・迷宮入りを回避する ユーザーからの報告を受けて、エラーの状況を再 現しようとしても、全く再現せず迷宮入りするケー スはないですか? 13
RUM(Real User Monitoring) ユーザーの動きを可視化する!! 14
実際に・・・ 自分のローカル環境でどれだけ再現しよう としても再現できなかった、動作がRUM のセッションリプレイをみて解決。 15
生成AI時代の開発 Code Developer GenAI Code Code 生成AIによりコードのアプトプットは増加 16
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
それらを捌くCI/CDが重要 17
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
レビューの待ちやPipeline自体の遅延が発生するケースも 18
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
PipelineもDatadogでO11Y出来る = CI Visibility 19
詳しい話は今日参加している賢者にお任せ 20
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
おざなりにすると予期せぬバグが混入 21
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
だからこそのO11Y、だからこそのDatadog !! 22
実際に・・・ ↑もともと3並行でAPIが叩かれすぐに終わるはず処理が ↑AIによって直列に書き換えられていた・・・・ がTraceで発見!! 23
す べての情報を活用したAI活用 System post-mortem MD DatadogのMCPを使って目指せ一発解決! MCP IaC 24
実際にMCPで調査・修正・確認を行ってみた 1 2 3 4 5 6 7 8 9
10 11 12 13 14 15 16 17 18 19 20 21 ## デプロイ前後の比較 | | 旧バージョン (2026.03.16.1135) | 新バージョン (2026.03.18.1148) | |---|---|---| | 直近15分のログ総数 | 1,660 | 2,297 | | DD_EXTENSION エラー | 8件 | 2件 | | エラー率 | 0.48% | 0.087% | 新バージョンでのエラーは logout 関数の1回分(2行で1セット)のみ です。 ## 評価 大幅に改善しています。旧バージョンでは全関数で満遍なく発生していたのが、新バージョンでは logout の み1件 に激減しました。 logout で残っている理由は、Okta への refresh token revocation がタイムアウトしている問題(別件のエ ラー)と関連している可能性があります。Okta 側のタイムアウトで Lambda の実行時間が長引き、Extension のフラッシュタイミングに影響しているケースです。 もう少し時間が経って全 Lambda が新バージョンに切り替わったら、ほぼゼロに近づくと思います。30分後く らいにもう一度確認しますか? 25
まとめ 26
・Datadogの機能を使って、自分のサービスの中身を知ろう! APMを駆使することで、バックエンドの課題を発見 RUMでユーザーの振舞いを可視化 ・AI開発時代のO11Y 生成AIによる非破壊的な変更をすぐにキャッチ MCPを使えば、原因の切り分け、対策、経過観察までお任せ ・O11Yを推進する設計や組織論 課題を発見した後、チームとして対応できるのか? アーキテクチャーとしても対応可能か? 27