Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ポストモーテム読書会のすすめ
Search
taxin
July 04, 2024
Technology
1
2.7k
ポストモーテム読書会のすすめ
taxin
July 04, 2024
Tweet
Share
More Decks by taxin
See All by taxin
Mackerelにおけるインシデント対応とポストモーテム - 現場での工夫と学び
taxin
0
110
監視SaaSの運用におけるObservability改善の歩み
taxin
4
5.3k
OpenTelemetry実践 はじめの一歩
taxin
0
3.2k
カスタムダッシュボードの活用方法とMackerel開発チームでの実践例
taxin
0
1.7k
SREを「続けていく」あなたへ
taxin
1
370
Cloud runユーザーから見たk8s
taxin
0
910
ローカルk8s環境のススメ / k8s-tools-for-local
taxin
0
1.2k
EKS 101
taxin
0
960
Other Decks in Technology
See All in Technology
AIを前提に、業務を”再構築”せよ IVRyの9ヶ月にわたる挑戦と未来の働き方 (BTCONJP2025)
yueda256
1
340
AWS資格は取ったけどIAMロールを腹落ちできてなかったので、年内に整理してみた
hiro_eng_
0
210
QAセントラル組織が運営する自動テストプラットフォームの課題と現状
lycorptech_jp
PRO
0
390
Black Hat USA 2025 Recap ~ クラウドセキュリティ編 ~
kyohmizu
0
530
機密情報の漏洩を防げ! Webフロントエンド開発で意識すべき漏洩パターンとその対策
mizdra
PRO
8
3k
ある編集者のこれまでとこれから —— 開発者コミュニティと歩んだ四半世紀
inao
4
2.1k
エンジニアに定年なし! AI時代にキャリアをReboot — 学び続けて未来を創る
junjikoide
0
180
Master Dataグループ紹介資料
sansan33
PRO
1
3.9k
バグと向き合い、仕組みで防ぐ
____rina____
0
260
ユーザーストーリー x AI / User Stories x AI
oomatomo
0
180
Introducing RFC9111 / YAPC::Fukuoka 2025
k1low
1
230
ググるより、AIに聞こう - Don’t Google it, ask AI
oikon48
0
860
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
84
9.3k
Balancing Empowerment & Direction
lara
5
740
Into the Great Unknown - MozCon
thekraken
40
2.2k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.5k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
Context Engineering - Making Every Token Count
addyosmani
9
380
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
For a Future-Friendly Web
brad_frost
180
10k
It's Worth the Effort
3n
187
28k
Code Reviewing Like a Champion
maltzj
527
40k
Large-scale JavaScript Application Architecture
addyosmani
514
110k
Transcript
ポストモーテム読書会 のすすめ id:taxintt / @taxin_tt 2024/07/05 Road To SRE NEXT@京都
1
自己紹介 • 西川 拓志 ◦ id: taxintt / @taxin_tt •
Mackerel開発チーム SRE 2
3 みなさん
4 ポストモーテム書いてますか?
5 ポストモーテム 「読んで」ますか?
ポストモーテムとは? • post-mortem=事後検証 ◦ > a medical examination of a
dead person's body in order to find out the cause of death. • インシデントの再発防止策を検討するための プロセス 6 https://dictionary.cambridge.org/ja/dictionary/english/post-mortem
7 https://sre.google/sre-book/postmortem-culture/
ポストモーテムとは? • インシデントの再発防止策をまとめた社内向け のドキュメント ◦ インシデントとそのインパクト ◦ その緩和や解消のために行われたアクション ◦ インシデントの根本原因
◦ インシデントの再発を避けるためのアクション 8
9 https://sre.google/workbook/postmortem-culture/
はてなのポストモーテム文化 • ポストモーテムを書く文化がある • 他チームのポストモーテムは社内ナレッジ ベースに載り、作成時には全社通知がくる ◦ ポストモーテムの存在を知ることができる ◦ 他チームのポストモーテムも閲覧できる
10
11 読むしかないでしょ
ポストモーテム読書会 • 社内外のポストモーテムから題材を1つ選ぶ • Cosenseを使いながら読書会を実施する ◦ 読書 + コメント記入タイム (20
~ 25分) ◦ コメントをみながら議論をする (30分) ◦ 議論の中で挙がったTODO を確認する (5分) 12
13
読書会やってよかったこと • 「生きた」学びを得て、活用できる ◦ 特に、社内のポストモーテムは障害原因から障害対応の 様子、再発防止策まで具体的なことが書いてある ◦ 具体的な内容の方が、学びを得たり改善に繋げやすい 14
読書会やってよかったこと ◦ インシデントの根本原因 ▪ 「この障害、自分達のプロダクトでも発生し得るのでは? 」 ◦ 障害対応のフロー・ドキュメント ▪ いいと思った所を真似する、アレンジして取り入れる
◦ インシデントの再発防止策 ▪ 先んじて調査・実施することで障害を未然に防ぐ 15
読書会で出たTODO • 障害対応のプロセスの改善 ◦ 障害対応ドキュメントテンプレート、Runbookの改善 ◦ メンテナンス時の考慮事項のドキュメント化 • 監視ルールの点検会 ◦
コンポーネントごとに監視が充足しているか点検する • etc… 16
17
18 ポストモーテム 読んで活用していきましょう