Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Bits AI SRE と Datadog MCP Server による未来 / datado...

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

Bits AI SRE と Datadog MCP Server による未来 / datadog-bits-ai-sre-and-mcp-server-feature

Avatar for Annosuke Yokoo

Annosuke Yokoo

March 16, 2026
Tweet

More Decks by Annosuke Yokoo

Other Decks in Technology

Transcript

  1. Bits AI SRE と Datadog MCP Server による未来 1 2026/03/13

    Datadogで実現するAI運用最前線 - Annosuke Yokoo (@866mfs)
  2. Annosuke Yokoo(横尾杏之介) Datadog - Sales Engineer X : @866mfs Awards

    : Google Cloud Partner Top Engineer 2025 Fellow Community : Jagu'e'r オブザーバビリティ分科会 Oraganizer Interest : Sauna 🧖 / Cloud Native 🚢 / SRE Agent 🔭 「技術書店 20」 で SRE Agent(Bits も少し触れます) について 本を書く予定です 進捗がすこぶる悪くて泣きそうです😇 Self Introduction
  3. Bits AI SRE と Datadog MCP Server による未来 3 2026/03/13

    Datadogで実現するAI運用最前線 - Annosuke Yokoo (@866mfs)
  4. Bits AI SRE と Datadog MCP Server による未来 5 2026/03/13

    Datadogで実現するAI運用最前線 - Annosuke Yokoo (@866mfs) Bits AI 話します! MCP 話します!
  5. Bits AI SRE と Datadog MCP Server による未来 6 2026/03/13

    Datadogで実現するAI運用最前線 - Annosuke Yokoo (@866mfs) Bits AI 話します! MCP 話します! 事前に資料見させていただいたところ ...
  6. Bits AI SRE と Datadog MCP Server による未来 7 2026/03/13

    Datadogで実現するAI運用最前線 - Annosuke Yokoo (@866mfs) Bits AI 話します! MCP 話します! 内容濃すぎて ワイ 話すことない 😇
  7. 今日話すこと • Datadog の AI Capability を見る • Bits AI

    による オブザーバビリティの可能性 • Datadog MCP が...
  8. AI の進化を支える Datadog Anysphere / 共同創業者 Sualeh Asif氏 もしDatadogが優秀でなかったら、Cursor の成長は

    もっと遅く、クラッシュが発生していただろう。 Datadogが優秀でなかったら成長は鈍化してい た。 OpenAI / Codex開発 Calvin French-Owen氏 電話を受け、何らかのアラートが表示され、 エラーログを確認すると、「ああ、コードベースのこの 部分にエラーがある」と気づくことができます 。
  9. On-Call Incident Management Event Management Workflow Automation App Builder Bits

    AI SRE Agent Service Management 12 Log Management Flex Logs Observability Pipelines Audit Trail Log Forwarding Jobs Monitoring Quality Monitoring Shared Platform Services Dashboards • CoScreen • Teams • Agent • OpenTelemetry • Notebooks • Software Catalog • IDE Plugins • ChatOps • SLOs • Case Management UNIFIED METRICS, LOGS, TRACES, SESSIONS Infrastructure Applications Data Observability Logs Digital Experience Security Software Delivery Datadog Platform 1,000+ INTEGRATIONS Cloud Security Code Security Cloud SIEM Sensitive Data Scanner Workload Protection App and API Protection Synthetics Testing & Monitoring Browser Real User Monitoring Mobile Real User Monitoring Session Replay Product Analytics Infrastructure Monitoring Metrics Container Monitoring Serverless Cloud Network Monitoring Network Device Monitoring Cloud Cost Management Cloudcraft CI Visibility Test Optimization Continuous Testing Error Tracking Feature Flags Application Performance Monitoring Distributed Tracing Continuous Profiler Universal Service Monitoring LLM Observability Database Monitoring Data Streams Monitoring AI Natural Language Querying • Root Cause Analysis • Anomaly Detection • Impact Analysis • Proactive Alerts • Autonomous Investigations • Bits AI
  10. On-Call Incident Management Event Management Workflow Automation App Builder Bits

    AI SRE Agent Service Management 13 Log Management Flex Logs Observability Pipelines Audit Trail Log Forwarding Jobs Monitoring Quality Monitoring Shared Platform Services Dashboards • CoScreen • Teams • Agent • OpenTelemetry • Notebooks • Software Catalog • IDE Plugins • ChatOps • SLOs • Case Management UNIFIED METRICS, LOGS, TRACES, SESSIONS Infrastructure Applications Data Observability Logs Digital Experience Security Software Delivery Datadog Platform 1,000+ INTEGRATIONS Cloud Security Code Security Cloud SIEM Sensitive Data Scanner Workload Protection App and API Protection Synthetics Testing & Monitoring Browser Real User Monitoring Mobile Real User Monitoring Session Replay Product Analytics Infrastructure Monitoring Metrics Container Monitoring Serverless Cloud Network Monitoring Network Device Monitoring Cloud Cost Management Cloudcraft CI Visibility Test Optimization Continuous Testing Error Tracking Feature Flags Application Performance Monitoring Distributed Tracing Continuous Profiler Universal Service Monitoring LLM Observability Database Monitoring Data Streams Monitoring AI Natural Language Querying • Root Cause Analysis • Anomaly Detection • Impact Analysis • Proactive Alerts • Autonomous Investigations • Bits AI AI Natural Language Querying • Root Cause Analysis • Anomaly Detection • Impact Analysis • Proactive Alerts • Autonomous Investigations • Bits AI さらに詳しく見る🔍
  11. AI for Datadog(Datadog を活用するための AI) g Security Cloud Service Management

    Software Delivery Digital Experience Monitoring Observability Monitor Operate Optimize Ship Test Understand Users Run Support Users Code Understand Business Resolve Issues • Bits AI SRE Agent • Bits AI Incident Commander • Voice AI for Mobile • Bits AI Assistant (Chat) • Conversational AI for Apps and Workflows • Bits AI Remediation Agent • AI Incident Onboarding • AI Agent Builder • AI Incident Analytics Insights • AI Incident Video • Bits AI Security Analyst • Anomalous Behavior Detection • Vulnerability false positive filtering • AI-native Static Analysis • Bulk vulnerability remediation • Sensitive data detection • Bits AI Detection • Natural Language Log Querying • Bits AI Kubernetes Remediation • APM Latency and Error Investigations • Architecture Recommendations • Bits AI FinOps Agent • Business Impact Analysis • Updog.ai • AI Research - Foundation Models • Bits AI Dev Agent • Datadog MCP Server • Bits AI Deployment Agent • CI Autofixing • Flaky Tests Quarantine • Automated Test Generation • Bits AI RUM Analyst • Automated End-to-End Synthetic Test Generation • UX Recommendations • Synthetic A/B Tests
  12. Datadog for AI(AI を活用するための Datadog) • LLM Observability • LLM

    Playground • GPU Monitoring • Distributed AI Observability • AI Agents Experimentation • Data Observability • AI Gateway Security Cloud Service Management Monitor Operate Optimize Ship Test Understand Users Run Support Users Code Understand Business Resolve Issues • MCP Server • Feature Flags • Bits AI Dev Agent • Bits AI Deployment Agent • LLM Experiments in CI • Deployment Gating • LLM Experimentation • Sentiment Analysis • Synthetic AI Agent Testing • Internal Developer Portal • App Builder • AI Agents Console • Workflow Automation • Case Management • Prompt Injection Protection • Malicious Tool Protection • Data Security • Auth Bypass Prevention • Secrets & Data Leak Redaction • Containment Policies (MCP, Tools, Data) • Discovery & Inventory • AI-SPM • Attack Path Analysis • Compliance & Audit • Automated Remediation Workflows • Supply Chain Detections • AI Integrations • AI Agent Builder • Multi-Agent Orchestration • AI Agent Task Triage • AI-Generated Relational Systems Software Delivery Digital Experience Monitoring Observability
  13. Datadog for AI(AI を活用するための Datadog) • LLM Observability • LLM

    Playground • GPU Monitoring • Distributed AI Observability • AI Agents Experimentation • Data Observability • AI Gateway Security Cloud Service Management Monitor Operate Optimize Ship Test Understand Users Run Support Users Code Understand Business Resolve Issues • MCP Server • Feature Flags • Bits AI Dev Agent • Bits AI Deployment Agent • LLM Experiments in CI • Deployment Gating • LLM Experimentation • Sentiment Analysis • Synthetic AI Agent Testing • Internal Developer Portal • App Builder • AI Agents Console • Workflow Automation • Case Management • Prompt Injection Protection • Malicious Tool Protection • Data Security • Auth Bypass Prevention • Secrets & Data Leak Redaction • Containment Policies (MCP, Tools, Data) • Discovery & Inventory • AI-SPM • Attack Path Analysis • Compliance & Audit • Automated Remediation Workflows • Supply Chain Detections • AI Integrations • AI Agent Builder • Multi-Agent Orchestration • AI Agent Task Triage • AI-Generated Relational Systems Software Delivery Digital Experience Monitoring Observability (予定されているものも含めて) 実はめちゃくちゃある!!!
  14. Bits AI の進化と種類 2023 2024 2025 2026 Q1 Q2 Q3

    Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 DASH 2023 DASH 2024 TODAY DASH 2025 re:Invent 2025 Chat with Bits AI autonomous investigation Bits AI SRE Bits AI K8s Remediation Bits AI Data Analyst Bits AI Security Analyst Bits AI Dev Agent Preview GA ??? ?????????
  15. 普通だったら ... • 調査フェーズ ◦ 決済時の メトリクス / ログ /

    トレースを見る ◦ 影響範囲(あるいは影響のあった時間帯)を調査する ◦ 過去の報告書から同様の事象でどのように対処したか調査する ◦ 他に考えられる要因がないか仮説を立てる ◦ 複数のメンバーを巻き込んで、分担して調査を頑張る ◦ 夜間なら孤独の戦い ... • 修正フェーズ ◦ Rollback / Revert するか判断 ◦ 起因部分のソースコードに対して Bug fix として PR を作成 ◦ ポストモーテムを作成
  16. 普通だったら・・・ • 調査フェーズ ◦ 決済時の メトリクス / ログ / トレースを見る

    ◦ 影響範囲(あるいは影響のあった時間帯)を調査する ◦ 過去の報告書から同様の事象でどのように対処したか調査する ◦ 他に考えられる要因がないか仮説を立て、実際にテレメトリーデータを参照する • 修正フェーズ ◦ Rollback / Revert する ◦ 該当部分のソースコードを探し Bug fix として変更を加える ◦ ポストモーテムを作成 それ全部、Bits が出来ます それ、全部 Bits AI SRE   で出来ます
  17. 普通だったら・・・ • 調査フェーズ ◦ 決済時の メトリクス / ログ / トレースを見る

    ◦ 影響範囲(あるいは影響のあった時間帯)を調査する ◦ 過去の報告書から同様の事象でどのように対処したか調査する ◦ 他に考えられる要因がないか仮説を立て、実際にテレメトリーデータを参照する • 修正フェーズ ◦ Rollback / Revert する ◦ 該当部分のソースコードを探し Bug fix として変更を加える ◦ ポストモーテムを作成 それ全部、Bits が出来ます しかも、数分で!
  18. RUNBOOK アラートに定義した 内容をベースに調査 MEMORY 過去の調査で学習し た内容を元に調査 GENERAL SEARCH Bitsが独自に調査 INITIAL

    FINDINGS 初動調査の結果 例:DBの遅延が原因でAPIエラー Hypothesis Investigation 自動でDatadog内のデータを調べて仮説検証 DBのCPU使用率 は? アプリのデプロイ は正常? 他の連携先APIで エラーはない? Investigation Conclusion 最終的な調査結果を根拠と合わせて提示 SUGGESTED CODE FIX (Preview) Code Fixを推奨 MONITOR ALERT アラート発報 約3分 約5分 Chat Chatを活用して追加調査依頼や、 Action、Workflow実行が可能
  19. The next-generation of Bits AI SRE ç GA Preview (Sign

    up for access) 1. A faster, more intelligent agent 2. Expanded coverage across Datadog products 3. Agent Trace view 4. Triage directly from chat 5. Bits AI SRE Actions for automating workflows 6. Third-party integrations: Grafana, Sentry, Splunk, Dynatrace, ServiceNow 7. Start an investigation from a prompt 8. Bits.md 9. Investigate Synthetic Multi-Step API and Browser Tests 10. Bits AI SRE API 11. Recommended Remediation 推論能力の大幅な向上、調査レイテンシの短縮、サードパーティーデータソースへの拡充に加え、 11 の新しいアップデートを導入。自動 RCA(根本原因分析)の基準を一段高いレベルへと引き上がった
  20. 37 3. Agent Trace View AIの「ブラックボックス」を解消 従来の「仮説ツリー」表示に加え、エージェ ントによる調査プロセスの詳細なログをス テップバイステップで確認できるようになり ました。

    ツール利用状況の完全な可視化 どのツールが呼び出され、どのようなデータ がクエリされたのかを正確に把握できます。 調査結果の妥当性を検証 Bitsの推論プロセスをリアルタイムに検証す ることで、あらゆる調査結果に対する確信と 信頼を深めることができます。 GA
  21. 38 6. Third-party integrations GA New in Preview Preview 外部テレメトリ、ソースコード、ドキュメン

    ト、そして過去のインシデント履歴を連 携させることで、Bitsはシステム全体(ス タック)を完全に把握できるようになりま す。これにより、情報の裏付けに基づい た、より深く多角的な根本原因分析 (RCA)が可能になります。 Sign up here for access
  22. 39 8. Bits.md Preview bits.mdは、お客様固有の環境に合 わせたトラブルシューティング方法 をBits AI SREに指南するための、 新しい設定ファイルです。

    タグの命名規則、アーキテクチャ構 成、用語集、そして調査のベストプ ラクティスといった「チームの知 見」をコード化して定義できます。 これにより、Bits が行うすべての 調査において、チーム全員が持つ共 通の背景知識(コンテキスト)が自 動的に反映されるようになります。 Sign up here for access
  23. 42 Bits AI Assistant (⌘Cmd + i) Preview Bits Assistantは、Datadogに

    搭載されたAI搭載のアシスタント で、自然言語を使ってDatadog全 体での検索や操作をサポートしま す。 Bits Assistantは、Webアプリ ケーション、モバイルアプリ、 Slackで利用可能です。 Sign up here for access
  24. MODEL INTELLIGENCE Bits はこれからもまだまだ進化します! TIME Pre-emptive remediation Zero customer exposure

    Increased productivity Dozens of hours saved per engineer per week Reduced downtime Quicker resolution and reduced business impact We are here
  25. Datadog MCP Server - tools リリース時 10 tools →現在は 30

    tools Logs get_logs Metrics list_metrics / get_metrics Spans & Traces list_spans / get_trace Infrastructure list_hosts Monitors get_monitors Incidents list_incidents / get_incident Logs analyze_datadog_logs / search_datadog_logs Metrics search_datadog_metrics / get_datadog_metric / get_datadog_metric_context Spans & Traces search_datadog_spans / get_datadog_trace Infrastructure search_datadog_hosts Monitors search_datadog_monitors Incidents search_datadog_incidents / get_datadog_incident Dashboard search_datadog_dashboards Notebook get_datadog_notebook / search_datadog_notebook Events search_datadog_events Database search_datadog_dbm_plans / search_datadog_dbm_samples RUM search_datadog_rum_events Error search_datadog_error_tracking_issues / get_datadog_error_tracking_issue Services search_datadog_services / search_datadog_service_dependencies Synthetics get_synthetics_tests / edit_synthetics_tests / synthetics_test_wizard Software Delivery search_datadog_ci_pipeline_events / aggregate_datadog_ci_pipeline_events / get_datadog_flaky_tests / aggregate_datadog_test_events / search_datadog_test_events GA
  26. Datadog MCP Server について • 追加費用(現時点では)はかかりません ◦ (将来的にはプレミアムプラン的なものでるかも?お楽しみに☺)ですが、 事前のアナウンスなしに課金は開始されませんのでご安心ください •

    Agent などからの大量アクセスや不正利用を防ぐためのレートリミットがあります ◦ 公開はされていないですが、通常の開発/運用ワークロードではまず問題にならないレベル • Datadog Org 内の権限が必要です ◦ Claude Code でも Cursor でも Datadog UI で認証が入ります
  27. まとめ • Datadog の AI Capability を見る ⇨ Bits をはじめとしたあらゆるレイヤーでの

    AI 活用により、オブザーバビリティ が誰でもできるように! • Bits AI による オブザーバビリティの可能性 ⇨ トラブルシューティング、問題解析は AI に頼ろう。全ては監視データが肝 • Datadog MCP が... ⇨ GA になりました!みんな使ってくれよな!