Upgrade to Pro — share decks privately, control downloads, hide ads and more …

観測から行動へ Datadog で実現する"活きる"オブザーバビリティ

観測から行動へ Datadog で実現する"活きる"オブザーバビリティ

Datadog Live Tokyo 2025 12 月の登壇資料になります。
https://www.event-site.info/datadog-live-tokyo-2025/

Avatar for Shuntaro Azuma

Shuntaro Azuma

December 17, 2025
Tweet

More Decks by Shuntaro Azuma

Other Decks in Technology

Transcript

  1. アジェンダ • オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと

    4 つの観測データ ~フロントからバックエンドまで~ • Datadog における 4 つの観測データの “活かし方” • まとめ 本セッションの 目的 • 「データを観測し”活用できる”」とはどういうことなのかを理解する • Datadog ではどのように “活用できる” のか知っていただく 来場者参加型デモ デモ
  2. • オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4

    つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
  3. 取得情報からシステムの状態を 推測・説明できる能力 = 活用できる能力 観測 能力 オブザーバビリティ( Observability) = Observe

    + Ability システムを運用する上で必要な 情報を取得でき 、 オブザーバビリティ とは 情報を “容易に” 確認でき、次のアクションへ “素早く” 繋げられること
  4. ケーススタディ - 単一サーバ(モノリシックシステム) オブザーバビリティとは言い難い例 CPU 使用率メトリクスを確認し、 高負荷状態にあることが分かった サーバーにログインし、プロセスや ログを直接見て原因を推測できる Observe

    + Ability CPU使用率 2025-12-16 xx:xx log 1 2025-12-16 yy:yy loglog 2025-12-16 zz:zz log 2 オブザーバビリティと言える例 どのプロセスがメトリクス高騰に起因し、 そのプロセスはどんな処理をしているのか “素早く” 調査できる スペック増強すべきかプロセスの処理を 見直すべきなのか “容易に” 判断できる pid 1 pid 10 Observe + Ability
  5. オブザーバビリティとは言い難い例 CPU 使用率メトリクスを確認し、 値が高かったことが分かった サーバーにログインし、プロセスや ログを直接見て原因を推測する Observe + Ability ケーススタディ

    - 単一サーバ(モノリシックシステム) CPU使用率 2025-12-16 xx:xx log 1 2025-12-16 yy:yy loglog 2025-12-16 zz:zz log 2 オブザーバビリティと言える例 どのプロセスがメトリクス高騰に起因し、 そのプロセスはどんな処理をしているのか “素早く” 調査できる スペック増強すべきかプロセスの処理を 見直すべきなのか “容易に” 判断できる pid 1 pid 10 Observe + Ability オブザーバビリティ ツールには • 必要な情報が十分に収集できるか だけでなく • いかに簡単に活用できるか が求められる
  6. • オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4

    つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
  7. それぞれが独立して稼働するサーバ群の中から 高負荷状態にあるサーバを 1 台特定し、その原因を探ります ケーススタディ - 単一サーバ(モノリシックシステム) デモ 特に以下の観点でデモをご覧ください •

    収集されたデータが Datadog UI 上でどう表現されているか • 画面の操作性はどうか • 複数のデータへのアクセスがどれほど容易に行えるか
  8. • オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4

    つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
  9. 単一サーバ(モノリシック)で運用していた時代と異なり、 アーキテクチャの分散化や外部連携の増加により、監視対象は多面化 現代システムの潮流 モノリシック vs マイクロサービス pid 1 pid 10

    オブザーバビリティに取り組むにあたり、 何を Observe(観測) するといいのでしょうか モノリシック マイクロサービス App1 App2 App3 Observe + Ability の部分を考えます コンテナ サーバ サーバレス App1 App2 App3
  10. 一般的に メトリクス、ログ、トレース の 3 つ データを取得するのがいいと言われています 出典:CNCF Observability White Paper

    現代システムにおける Observe(観測) メトリクス ログ 2025-12-16 xx:xx log 1 2025-12-16 yy:yy loglog 2025-12-16 zz:zz log 2 トレース / Main Handler Sub Call
  11. 現代システムにおける Observe(観測) メトリクス ログ 2025-12-16 xx:xx log 1 2025-12-16 yy:yy

    loglog 2025-12-16 zz:zz log 2 トレース / Main Handler Sub Call これらは バックエンド の観測 バックエンドの観測だけでは “実際のユーザー体験 ” を捉えきれません システムを使っているユーザ(*) (*)モバイル端末 世帯保有率 97.4% 出典: 総務省 令和6年版情報通信白書
  12. ケーススタディ - UI を持つマイクロサービス バックエンドの観測のみ フロント+バックエンドの観測 API の成功、サービス間の遅延、 内部エラーの調査は可能 トレース

    トレース トレース ログ メトリクス UI 崩れや描画速度、エラーに遭遇した ユーザの画面操作再現 などは確認できない しかし..
  13. ケーススタディ - UI を持つマイクロサービス バックエンドの観測のみ フロント+バックエンドの観測 API の成功、サービス間の遅延、 内部エラーの調査は可能 ユーザーが実際にどの画面で、どの操作中に

    問題に直面したのかを特定可能 表示速度・操作感・レンダリングの状態など “体感性能”を数値で把握できる フロントのエラーとバックエンドの処理を 紐づけ、原因を端から端まで追跡できる トレース トレース トレース ログ メトリクス ユーザー体験
  14. 現代システムにおける Observe(観測) トレース トレース トレース ログ メトリクス ユーザー体験 メトリクス (インフラ)

    ログ トレース ユーザー体験 + フロントエンド バックエンド そしてただ 4 つのデータを収集するだけでなく、 “活用” できて初めてオブザーバビリティ( Observe + Ability)
  15. • オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4

    つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
  16. 来場者皆様にマイクロサービスで構築されたデモサイトへアクセスしていただき、 発生したエラーを Datadog でどう調査するのか 画面操作がどのように Datadog で分析できるのか を確認します 来場者参加型デモ 1.

    気に入ったステッカーをいくつか購入してみてください 2. 1 つのステッカーを大量購入(例: 100億個)してみてください ケーススタディ - UI を持つ現代システム 皆様に お願いしたいこと
  17. フロントの Observe(観測) によって エラー発生時の実ユーザの行動履歴やコンバージョン率まで簡単に分析することができ バックエンドの Observe(観測)によって エラーの原因やパフォーマンス分析が瞬時に特定、フロントエンドと紐づけて確認できる Datadog における 4

    つの観測データの “活かし方” Observe + Ability パフォーマンス問題の可視化 改善サイクルの加速 障害対応/トラブルシューティング の高速化 体験データを起点にした 迅速なマーケティング戦略 Datadog の Datadog によって創出される価値の例
  18. • オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4

    つの観測データ ~フロントからバックエンドまで~ • Datadog における 4 つの観測データの “活かし方” • まとめ
  19. オブザーバビリティ = Observe(観測) + Ability(活用) 情報を “容易に” 確認でき、次のアクションへ “素早く” 繋げられること

    UI を持つ現代アーキテクチャではユーザー体験がより重要視され、 バックエンドだけでなくフロントエンドの監視も必要 本日お話しした内容まとめ Datadog では、フロントエンド含む多種多様な情報が取得でき、 直感的な UI や相関付いたデータから “活用” に繋げることができる