Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SLO Docsのすゝめ
Search
ryuichi1208
June 06, 2024
9
3.5k
SLO Docsのすゝめ
ryuichi1208
June 06, 2024
Tweet
Share
More Decks by ryuichi1208
See All by ryuichi1208
入門リトライ
ryuichi1208
18
6.9k
超入門SRE 2025
ryuichi1208
4
1.3k
Goで作って学ぶWebSocket
ryuichi1208
5
3.5k
コード化されていない稼働中のサーバを移設_再構築する技術
ryuichi1208
20
9.6k
AI前提のサービス運用ってなんだろう?
ryuichi1208
9
1.8k
入門 バックアップ
ryuichi1208
22
10k
効果的なオンコール対応と障害対応
ryuichi1208
9
3.8k
コロナ禍とその後:地方エンジニアが学んだキャリア戦略の変遷
ryuichi1208
6
440
入門オンコール対応
ryuichi1208
10
3.6k
Featured
See All Featured
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
12
1.4k
Making the Leap to Tech Lead
cromwellryan
133
9.2k
Fontdeck: Realign not Redesign
paulrobertlloyd
83
5.4k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Raft: Consensus for Rubyists
vanstee
137
6.8k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
102
18k
Building a Modern Day E-commerce SEO Strategy
aleyda
39
7.2k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
118
51k
Scaling GitHub
holman
459
140k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
30k
Docker and Python
trallard
44
3.3k
Git: the NoSQL Database
bkeepers
PRO
429
65k
Transcript
1 SLO Docsのすゝめ 渡部 ⿓⼀ 2024/06/06 ゆるSRE勉強会#6
技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi •
SNS: @ryuichi_1208 • GMOペパボでSRE • 好きなこと: EOL対応、障害対応
3 • SRE NEXT 関連イベントをやります! ◦ 6/29@仙台 ◦ 7/5@京都 ◦
7/20@広島 宣伝
SLI/SLOの運⽤ 4
なんでやるんだっけ? 5
6 • サービス品質の明確化 ◦ どれくらいの品質を⽬指すのかをメンバー間ではっきりさせる • インシデント対応の効率化 • リソースの最適化 •
継続的な改善の推進 • ビジネス上の意思決定の⽀援/フレームワーク SLI/SLOの運⽤がもたらし得るメリット
7 SLI/SLOを定めるぞ! 運⽤もバリバリやっていくぞ!
8 思ったよりスムーズに運⽤できてないな...
なんでだろう? 9
10 • チームメンバーの⼊れ替わりなどでなぜこの指標/⽬標になっているのかが不明 • エラーバジェット枯渇した際のアクション • いつ定義されたのか、ずっとそのままの運⽤になってしまう ◦ SLOをきつくするか緩めるかもしくはSLI⾃体を⾒直すか決めてない •
⼀部のメンバーだけで運⽤されており全体へ浸透していない ◦ サービスごとに定義されていて情報がまとめられていない SLI/SLOの運⽤の課題
SLO Docs 11
12 • WEB+DB PRESS Vol.130で取り上げられていたもの • SLI/SLOを運⽤する上で必要となる情報を取りまとめたドキュメント • テンプレートを決めておくことで複数サービス/ロールでも認知負荷を低めで運⽤を ⾏うことができる
• GitHub上のMarkdownで管理して変更は全てissue or Pull Requestで管理 SLO Docs
13 • 概要 • SLI/SLOの設定値/設定理由 • ⽬的/⽬的としないこと • SLO Miss
Policy / Postmortem Policy • エスカレーションポリシー • SLI/SLOを変更するためのルール ◦ どのルートで承認が必要なのか ◦ どういったタイミングでSLI/SLOの⾒直しを⾏うのかを記載 実際のSLO Docsの抜粋
14
15 • OpenSLO/OpenSLO • YAML使⽤して信頼性とパフォーマンスの⽬標を宣⾔的に定義するサービス レベル ⽬標⾔語(SLO as Code) •
SLO Docsに反映しておくことで⾃動的にダッシュボードやアラート設定 ◦ 数が多くなってくると設定してテストするだけでもtoilになりがち OpenSLOとの組み合わせ
まとめ 16
17 • 継続的に調整するのが⼤事だし調整した議論を記録を残すのが⼤事 ◦ 情報を⼀箇所にまとめておくことで把握しやすくする ◦ 導⼊時の苦労と失敗もissueに残しておく(試⾏錯誤を後から追えるように) • 良いSLI/SLOライフを! まとめ
18 ご静聴ありがとうございました