Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
超入門 SRE
Search
ryuichi1208
June 25, 2024
Technology
5
3.2k
超入門 SRE
ryuichi1208
June 25, 2024
Tweet
Share
More Decks by ryuichi1208
See All by ryuichi1208
障害対応を楽しむ7つのコツ
ryuichi1208
0
160
SLO Docsのすゝめ
ryuichi1208
5
1.9k
SMTPでのOpenTelemetryの可能性を考えてみる
ryuichi1208
6
2.4k
実録_マルチテナント環境でのGmailガイドライン対応
ryuichi1208
8
1.9k
5分でわかるGoの自動計装
ryuichi1208
3
1.4k
入門EOL対応
ryuichi1208
23
11k
Mackerelを触り始めて2年経ったので 作ってきたプラグインを振り返る
ryuichi1208
1
1.6k
SREという働き方
ryuichi1208
0
400
SREのチーム共通言語をGoにした話
ryuichi1208
3
580
Other Decks in Technology
See All in Technology
Adaptor, Helmet, SSG
watany
0
130
RAGだけじゃない! 古くて新しいベクトル検索の世界 | DevelopersIO 2024 福岡
quiver
0
330
What's New in Firebase 2024
firebasethailand
1
130
GA technologiesの経営戦略から駆動するデータ基盤構築
pacocat
0
420
個人開発でLIFFとMessagingAPIを使ってわかった5つのこと
diggymo
0
270
PHPカンファレンス福岡2024 【超特急】SQLアンチパターン総おさらいLT
ytsuzaki
0
510
feature flag と OpenTelemetry
biwashi
5
1.3k
Refactoring to Expressive Kotlin
davidkwon7
0
150
マルチエージェントで性能が上がったText-to-SQLのいま/Text-to-SQL
yoshidashingo
2
970
作りすぎない技術 - API時代の開発努力の在り方について考える / Thinking about the state of development efforts in the API era
yokawasa
4
1.2k
IaCツールのいろいろ
takesection
0
120
State of Amazon Location Service
dayjournal
0
160
Featured
See All Featured
Practical Orchestrator
shlominoach
184
9.9k
The Straight Up "How To Draw Better" Workshop
denniskardys
228
130k
Faster Mobile Websites
deanohume
300
30k
Music & Morning Musume
bryan
42
5.8k
Clear Off the Table
cherdarchuk
87
320k
Statistics for Hackers
jakevdp
791
220k
Designing for humans not robots
tammielis
247
25k
Code Reviewing Like a Champion
maltzj
516
39k
Agile that works and the tools we love
rasmusluckow
325
20k
Build your cross-platform service in a week with App Engine
jlugia
227
17k
Mobile First: as difficult as doing things right
swwweet
218
8.7k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
222
21k
Transcript
1 超入門 SRE 何事もバランスが大事編 渡部 龍一/ GMO PEPABO inc. はじめてのIT勉強会
in 仙台(2024)
技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi •
GMOペパボ/仙台からリモート • ロール: SRE • SNS: @ryuichi_1208 • 好きなこと: EOL対応、障害対応 • SRE NEXTスタッフ
3 SRE、聞いたことありますか?
4 • SRE(Site Reliability Engineering)とは、元々Googleが提唱したシステム管理とサービ ス運⽤に対するアプローチ ◦ SREは、ソフトウェアエンジニアに運⽤チームの設計を依頼した時にできあがるもの ◦ 直訳するとサイト信頼性⼯学
▪ 信頼性⼯学とは「故障」という品質を扱う学問 ▪ 「事業の経済的損失」につながる可能性のある障害を全体的に最⼩にすることが⽬的 ◦ Site Reliability Engineerで職種を指したりする • Webサイトの信頼性を重要視したエンジニアリングを⾏ったり組織に対して導⼊ SREとは
5 なんで必要なの?
6 A社というスタートアップ企業と B社という新規参⼊をしてきた企業
7 まだ競合もいないサービスを作れた! 最高のチームで最高のサービスをやっていくぞ! A社
8 ユーザー数も順調に伸びて売り上げも好調! 今度テレビCMでさらなるユーザー獲得を狙うぞ! A社
9 CM放映後
10 CM流れた瞬間アクセス殺到で繋がらなくなった CMによるユーザー増加も見込みよりも下回ってしまった ... 新機能をリリースしたいけどアクセスを捌けないとユーザー増えな いしチームメンバー全員で対応しよう ... A社
11 この業界まだまだユーザー増えそう! 新機能開発しまくって宣伝してユーザー獲得するぞ! A社 B社
12 A社 B社 アクセス捌けるようになったが機能面で B社に劣ってしまっ ている。。。 新規ユーザーも増えないし困った。。。
13 • SREは信頼性をエンジニアリングしていく ◦ Webサイトを運営しながら短いサイクルで新機能のリリースを⾏うことを⽬標としていく ◦ SLO‧SLIを定義しサービスレベルの⽬標や指標を決めて運⽤していく ▪ 例えば⽬標としていた稼働率よりも低い時間しか稼働してないなら改善のために機能開発を⽌める ▪
⽬標よりも⾼い時間稼働しているなら多少のサービスダウンは機能開発を継続する ▪ ビジネス影響を考慮して⽬標数値を決めることをSREがサービスオーナーと決定していく SREがいると
14 • 信頼性に繋がることはなんでもやるという気概 • CUJ/SLI/SLO、エラーバジェットの設定 • CI/CDの整備 • 監視、オブザーバビリティの実装 •
障害対応、オンコール対応、ポストモーテム • コスト削減 SREの活動内容例
15 ⾊々やれて楽しい!
16 もっと知りたい
17
18
19 SRE NEXT@東京に向けて各地でイベントを開催 福岡、仙台、京都、広島で実施 そのイベントが今週の土曜日に開催されます! 参加者募集中!
20 ご静聴ありがとうございました