Upgrade to Pro — share decks privately, control downloads, hide ads and more …

エラーバジェット、どう運用していますか?/ Error budget practice

エラーバジェット、どう運用していますか?/ Error budget practice

SRE Lounge #13 登壇資料

開発速度と信頼性のバランスを取るためのエラーバジェット。これが枯渇した場合にSREと関係者はどのように行動することとしているか、その考え方や取り組みの事例についてお話しします。

https://sre-lounge.connpass.com/event/227250/

Avatar for shonansurvivors

shonansurvivors

November 19, 2021
Tweet

More Decks by shonansurvivors

Other Decks in Technology

Transcript

  1. 山原 崇史 (やまはら たかし) 所属 株式会社ビズリーチ(Visionalグループ) HRMOSプロダクト本部 RSプロダクト部 Site Reliability

    Engineeringグループ 経歴 SIer・銀行・Web系等を経て、2021年2月に株式会社ビズリーチ入社 自己紹介 @shonansurvivors
  2. ◦ リリースを一時的に停止する/リリース速度を下げる ◦ システムの弾力性を増す/パフォーマンスを改善する ◦ テストや開発へのリソース投資を追加する (p37〜p38から抜粋・要約) 2017 Besty Beyer,

    Chris Jones, Jennifer Petoff, Niall Richard Murphy「Site Reliability Engineering」O’REILLY • 開発速度よりも信頼性を優先し、上記のような行動を取る ◦ なお、枯渇してからではなく、枯渇しそうになった段階で上記に準じた 行動を取り始めても良い エラーバジェットが枯渇したら?