Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DatadogとPagerDutyで改善するシステム障害対応

 DatadogとPagerDutyで改善するシステム障害対応

本資料は、2024-08-06開催のPagerDuty on Tourでの登壇資料です。
デモページの動画は、こちらをご覧ください。
https://youtu.be/vT1W3I3KFEM?feature=shared

Taiji HAGINO

August 06, 2024
Tweet

Video

More Decks by Taiji HAGINO

Other Decks in Technology

Transcript

  1. We'll learn about... • 我々が抱える課題 • DatadogによるPagerDutyの活用 • デモ ◦

    DatadogとPagerDutyを組み合わせて、 検出と応答時間を短縮させてみよう!
  2. PagerDutyとDatadog 実際の活用方法 時差を意識することなくエンジニアをス ムーズに連携 対応する人材がいない場合のフォローアッ プやエスカレーションを管理 多くのチームが多く のサービスを管理、ス ジュールマッピン Slack

    との統合 アラートの優先順位を設定 緊急時のシフト変更をサポート オンコール時、必要に応じてダッシュボー ドを利用 履歴を一目で確認でき、コールに関するパ ターンがあるかどうかを確認 オンコール/オフコール時のリマインド