Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SLO Docsのすゝめ
Search
ryuichi1208
June 06, 2024
9
3.9k
SLO Docsのすゝめ
ryuichi1208
June 06, 2024
Tweet
Share
More Decks by ryuichi1208
See All by ryuichi1208
AI前提のサービス運用について再考する
ryuichi1208
5
1.3k
A Shallow Dive into the World of TCP
ryuichi1208
1
590
入門リトライ
ryuichi1208
20
7.4k
超入門SRE 2025
ryuichi1208
4
1.4k
Goで作って学ぶWebSocket
ryuichi1208
5
3.8k
コード化されていない稼働中のサーバを移設_再構築する技術
ryuichi1208
20
14k
AI前提のサービス運用ってなんだろう?
ryuichi1208
9
1.9k
入門 バックアップ
ryuichi1208
22
11k
効果的なオンコール対応と障害対応
ryuichi1208
9
4k
Featured
See All Featured
Done Done
chrislema
185
16k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4k
Making Projects Easy
brettharned
120
6.4k
Side Projects
sachag
455
43k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.9k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Into the Great Unknown - MozCon
thekraken
40
2.1k
Rails Girls Zürich Keynote
gr2m
95
14k
Building Applications with DynamoDB
mza
96
6.7k
The Straight Up "How To Draw Better" Workshop
denniskardys
238
140k
Transcript
1 SLO Docsのすゝめ 渡部 ⿓⼀ 2024/06/06 ゆるSRE勉強会#6
技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi •
SNS: @ryuichi_1208 • GMOペパボでSRE • 好きなこと: EOL対応、障害対応
3 • SRE NEXT 関連イベントをやります! ◦ 6/29@仙台 ◦ 7/5@京都 ◦
7/20@広島 宣伝
SLI/SLOの運⽤ 4
なんでやるんだっけ? 5
6 • サービス品質の明確化 ◦ どれくらいの品質を⽬指すのかをメンバー間ではっきりさせる • インシデント対応の効率化 • リソースの最適化 •
継続的な改善の推進 • ビジネス上の意思決定の⽀援/フレームワーク SLI/SLOの運⽤がもたらし得るメリット
7 SLI/SLOを定めるぞ! 運⽤もバリバリやっていくぞ!
8 思ったよりスムーズに運⽤できてないな...
なんでだろう? 9
10 • チームメンバーの⼊れ替わりなどでなぜこの指標/⽬標になっているのかが不明 • エラーバジェット枯渇した際のアクション • いつ定義されたのか、ずっとそのままの運⽤になってしまう ◦ SLOをきつくするか緩めるかもしくはSLI⾃体を⾒直すか決めてない •
⼀部のメンバーだけで運⽤されており全体へ浸透していない ◦ サービスごとに定義されていて情報がまとめられていない SLI/SLOの運⽤の課題
SLO Docs 11
12 • WEB+DB PRESS Vol.130で取り上げられていたもの • SLI/SLOを運⽤する上で必要となる情報を取りまとめたドキュメント • テンプレートを決めておくことで複数サービス/ロールでも認知負荷を低めで運⽤を ⾏うことができる
• GitHub上のMarkdownで管理して変更は全てissue or Pull Requestで管理 SLO Docs
13 • 概要 • SLI/SLOの設定値/設定理由 • ⽬的/⽬的としないこと • SLO Miss
Policy / Postmortem Policy • エスカレーションポリシー • SLI/SLOを変更するためのルール ◦ どのルートで承認が必要なのか ◦ どういったタイミングでSLI/SLOの⾒直しを⾏うのかを記載 実際のSLO Docsの抜粋
14
15 • OpenSLO/OpenSLO • YAML使⽤して信頼性とパフォーマンスの⽬標を宣⾔的に定義するサービス レベル ⽬標⾔語(SLO as Code) •
SLO Docsに反映しておくことで⾃動的にダッシュボードやアラート設定 ◦ 数が多くなってくると設定してテストするだけでもtoilになりがち OpenSLOとの組み合わせ
まとめ 16
17 • 継続的に調整するのが⼤事だし調整した議論を記録を残すのが⼤事 ◦ 情報を⼀箇所にまとめておくことで把握しやすくする ◦ 導⼊時の苦労と失敗もissueに残しておく(試⾏錯誤を後から追えるように) • 良いSLI/SLOライフを! まとめ
18 ご静聴ありがとうございました