Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SREの知識地図 - 第2章の紹介 - / Knowledge Map of SRE – ...

SREの知識地図 - 第2章の紹介 - / Knowledge Map of SRE – Introduction to Chapter 2 –

Avatar for Takeshi Kondo

Takeshi Kondo

November 27, 2025
Tweet

More Decks by Takeshi Kondo

Other Decks in Technology

Transcript

  1. Takeshi Kondo(@chaspy) • 『SREの知識地図』第二章著者 • 教育系ITサービス開発組織の部長 • SLOの組織への導入をリードした • SRE

    NEXT 2020/2022/2023/2024 登壇 • 2020/2024/2025にコアスタッフとして 参加。 • 好きなSaaSはDatadog。
  2. 2.2 なぜ SLO が重要なのか • 推しの図 - みんな大好き4象限 ◦ 信頼性が満足/不満

    ◦ 機能開発or信頼性向上 • 以下のシナリオが好ましい ◦ 信頼性が不足している時に信頼性 向上をする ◦ 信頼性が満足している時は機能開 発を優先する
  3. 2.3 エラーバジェットの 理解と活用 • 推しのコラム • SLO 違反の場合のアクション ◦ 1.

    段階的な制限型 ◦ 2. 重要度判断型 ◦ 3. 時期考慮型 ◦ 4. ハイブリッド型 • “完璧”なSLOを設定するのは難し いことの説明になっている 大切なのは、これらのルールを絶対的な基準では なく判断の指針 として扱うことです。そして最終的 な判断は、プロダクトマネージャー(または事業責 任者)とSRE /開発チームが協議のうえで行うこ とが望ましいでしょう。 プロダクトマネージャーはビジネスの優先度を、 SRE /開発チームは技術的なリスクをそれぞれ 評価します。両者のバランスをとりながら意思決定 を行い、ビジネスの成長と信頼性の両立を目指 し、組織の状況にあわせて柔軟に運用する ことを おすすめします。
  4. 2.4 SLO 導入ステップ • 推しの節 ◦ 1. クリティカルユーザージャーニーの特定 ◦ 2.

    適切な目標値の設定 ◦ 3. 組織的な合意・運用体制 ◦ 4. 継続的改善のしくみ作り 1. 経営陣を含むステークホル ダーの理解と支持 2. 役割と責任の明確化 3. 継続的な改善のしくみ作り 4. 組織全体への浸透