Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
”信頼性”の使い方
Search
gr1m0h
August 23, 2023
Technology
0
230
”信頼性”の使い方
gr1m0h
August 23, 2023
Tweet
Share
More Decks by gr1m0h
See All by gr1m0h
"君は見ているが観察していない"で考えるインシデントマネジメント
grimoh
4
3.4k
Enabling Client-side SLO
grimoh
7
4.6k
Luupの開発組織におけるインシデントマネジメントの変遷 ver.RoadtoSRENEXT2024
grimoh
2
860
Luupの開発組織におけるインシデントマネジメントの変遷
grimoh
2
1.5k
IoTサービスにおけるSLI設計とLUUPでの実践
grimoh
1
1.7k
Luupの開発組織におけるインシデントマネジメントのこれから
grimoh
2
1.3k
電動マイクロモビリティのシェアサービス「LUUP」におけるEnabling SLOの実践
grimoh
3
1.9k
SRE NEXT 2023への招待
grimoh
0
6.1k
LuupにおけるSLOの物語
grimoh
2
6.3k
Other Decks in Technology
See All in Technology
SREからゼロイチプロダクト開発へ ー越境する打席の立ち方と期待への応え方ー / Product Engineering Night #8
itkq
2
930
30代からでも遅くない! 内製開発の世界に飛び込み、最前線で戦うLLMアプリ開発エンジニアになろう
minorun365
PRO
11
3k
AI AgentOps LT大会(2025/04/16) Algomatic伊藤発表資料
kosukeito
0
140
2025-04-24 "Manga AI Understanding & Localization" Furukawa Arata (CyberAgent, Inc)
ornew
1
200
Spring Bootで実装とインフラをこれでもかと分離するための試み
shintanimoto
7
850
Стильный код: натуральный поиск редких атрибутов по картинке. Юлия Антохина, Data Scientist, Lamoda Tech
lamodatech
0
740
「経験の点」の位置を意識したキャリア形成 / Career development with an awareness of the “point of experience” position
pauli
4
100
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
0
110
3月のAWSアップデートを5分間でざっくりと!
kubomasataka
0
120
Road to Go Gem #rubykaigi
sue445
0
760
ワールドカフェI /チューターを改良する / World Café I and Improving the Tutors
ks91
PRO
0
120
持続可能なドキュメント運用のリアル: 1年間の成果とこれから
akitok_
1
190
Featured
See All Featured
The Language of Interfaces
destraynor
157
25k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Agile that works and the tools we love
rasmusluckow
328
21k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
13
1.4k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
13
680
The MySQL Ecosystem @ GitHub 2015
samlambert
251
12k
Reflections from 52 weeks, 52 projects
jeffersonlam
349
20k
Building Applications with DynamoDB
mza
94
6.3k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
47
2.7k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Transcript
“信頼性”の使い方 2023年8月23日 すごい広島535 with Unity & IT系の濃ゆい話をする会 LT Wataru Tsuda
/ gr1m0h
whoami Wataru Tsuda / gr1m0h SRE @ Luup,inc. SRE Lounge
/ SRE NEXT 運営メンバー Platform Engineering Meetup 運営メンバー SRE NEXT 2023 Chair
“信頼性”とは 「[システムが]求められる機能を、定められた条件の下で、定められた期間 にわたり、障害を起こすことなく実行する確率」 P.O’Connor and A.Kleyner, Practical Reliability Engineering, 5th
edition: Wiley, 2012. https://sre.google/sre-book/preface/#id-gA2u2Iyh4 システムが予期した機能を提供し、約束された条件で動作すること システムが安全なデータ保管方法を使用し、データ漏洩のリスクを最小限に 抑えていること
“信頼性”とは 人を選ぶ時は“信頼”が必要 サービスを選ぶ時も”信頼”が必要(信頼性) 信頼できるかは”期待に応えられるか”がある 期待値
“信頼性”の辛さ • コストがかかる ◦ 100%に近づけるためにコストがどんどん跳ね上がる ◦ 直線ではなく急な曲線を描いて増加していく • 100%は不可能 ◦
世の中に完全なものはない....よく言われるやつ ◦ (実際100%は不要です) • 「非機能」「守り」的アプローチなので「機能」開発と反する ◦ 機能開発してリリースしてユーザーに価値を届けたい by 開発者vs 機 能開発のスピードを落として障害を起こさないようにしたい by 運用者
“信頼性”の辛さ • コストがかかる ◦ 100%に近づけるためにコストがどんどん跳ね上がる ◦ 直線ではなく急な曲線を描いて増加していく • 100%は不可能 ◦
世の中に完全なものはない....よく言われるやつ ◦ (実際100%は不要です) • 「非機能」「守り」的アプローチなので「機能」開発と反する ◦ 機能開発してリリースしてユーザーに価値を届けたい by 開発者vs 機 能開発のスピードを落として障害を起こさないようにしたい by 運用者 ”信頼性”をコントロールする必要がある!
“信頼性工学”を実践する! 信頼性工学 = SRE:Site Reliability Enginnering SREとは? • 本番環境を信頼性高く開発/運用していくための一連の手法/考え方 •
class SRE implements DevOps 信頼性のコントロールのためにSREが必要 = 開発チームが信頼性という観点を獲得するためにSREが必要
“信頼性工学”を実践する! 信頼性工学 = SRE:Site Reliability Enginnering SREとは? • 本番環境を信頼性高く開発/運用していくための一連の手法/考え方 •
class SRE implements DevOps 信頼性のコントロールのためにSREが必要 = 開発チームが信頼性という観点を獲得するためにSREが必要 ”SRE”をどうやって活用すれば、 信頼性をコントロールできるのか?
“信頼性指標”を使う! 信頼性指標 = SLI:Service Level Indicator SLIとは? • 信頼性をメトリクスにできる形で測定する •
数値にすることで意思決定が容易になる ◦ 目標を設定してそれを達成しているかどうか(よくやるやつ SLIの目標値(SLO)
SLI/SLOを使うことで.... • “サービスがユーザーの期待値に答えているか” を測定し、定量的な判断を 可能にする • 監視をSLI/SLOベースにすると、アラートを常にアクショナブルなものにできる • SLI/SLOを組織全体の意思決定指標として活用することができる
さいごに
whoami Wataru Tsuda / gr1m0h SRE @ Luup,inc. SRE Lounge
/ SRE NEXT 運営メンバー Platform Engineering Meetup 運営メンバー SRE NEXT 2023 Chair
whoami Wataru Tsuda / gr1m0h SRE @ Luup,inc. SRE Lounge
/ SRE NEXT 運営メンバー Platform Engineering Meetup 運営メンバー SRE NEXT 2023 Chair ロール(役割)としてのSREは信頼性工学の専門家という立場 SREを実践、活用していくのは開発組織全体!会社全体!