Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ポストモーテム読書会のすすめ
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
taxin
July 04, 2024
Technology
3k
1
Share
ポストモーテム読書会のすすめ
taxin
July 04, 2024
More Decks by taxin
See All by taxin
Mackerelにおけるインシデント対応とポストモーテム - 現場での工夫と学び
taxin
0
180
監視SaaSの運用におけるObservability改善の歩み
taxin
4
6.1k
OpenTelemetry実践 はじめの一歩
taxin
0
3.5k
カスタムダッシュボードの活用方法とMackerel開発チームでの実践例
taxin
0
1.9k
SREを「続けていく」あなたへ
taxin
1
390
Cloud runユーザーから見たk8s
taxin
0
940
ローカルk8s環境のススメ / k8s-tools-for-local
taxin
0
1.3k
EKS 101
taxin
0
1k
Other Decks in Technology
See All in Technology
ある製造業の会社全体のAI化に1エンジニアが挑んだ話
kitami
2
790
AIペネトレーションテスト・ セキュリティ検証「AgenticSec」ご紹介資料
laysakura
0
1.6k
解剖"React Native"
hacusk
0
120
新メンバーのために、シニアエンジニアが環境を作る時代
puku0x
0
510
推し活エージェント
yuntan_t
1
900
建設的な現実逃避のしかた / How to practice constructive escapism
pauli
4
300
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.2k
AI時代に新卒採用、はじめました/junior-engineer-never-die
dmnlk
0
230
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.3k
Cortex Code君、今日から内製化支援担当ね。
coco_se
0
320
試されDATA SAPPORO [LT]Claude Codeで「ゆっくりデータ分析」
ishikawa_satoru
0
340
New CBs New Challenges
ysuzuki
1
170
Featured
See All Featured
Ruling the World: When Life Gets Gamed
codingconduct
0
190
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.4k
Producing Creativity
orderedlist
PRO
348
40k
How GitHub (no longer) Works
holman
316
150k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.8k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
500
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
180
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.4k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
190
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2k
Transcript
ポストモーテム読書会 のすすめ id:taxintt / @taxin_tt 2024/07/05 Road To SRE NEXT@京都
1
自己紹介 • 西川 拓志 ◦ id: taxintt / @taxin_tt •
Mackerel開発チーム SRE 2
3 みなさん
4 ポストモーテム書いてますか?
5 ポストモーテム 「読んで」ますか?
ポストモーテムとは? • post-mortem=事後検証 ◦ > a medical examination of a
dead person's body in order to find out the cause of death. • インシデントの再発防止策を検討するための プロセス 6 https://dictionary.cambridge.org/ja/dictionary/english/post-mortem
7 https://sre.google/sre-book/postmortem-culture/
ポストモーテムとは? • インシデントの再発防止策をまとめた社内向け のドキュメント ◦ インシデントとそのインパクト ◦ その緩和や解消のために行われたアクション ◦ インシデントの根本原因
◦ インシデントの再発を避けるためのアクション 8
9 https://sre.google/workbook/postmortem-culture/
はてなのポストモーテム文化 • ポストモーテムを書く文化がある • 他チームのポストモーテムは社内ナレッジ ベースに載り、作成時には全社通知がくる ◦ ポストモーテムの存在を知ることができる ◦ 他チームのポストモーテムも閲覧できる
10
11 読むしかないでしょ
ポストモーテム読書会 • 社内外のポストモーテムから題材を1つ選ぶ • Cosenseを使いながら読書会を実施する ◦ 読書 + コメント記入タイム (20
~ 25分) ◦ コメントをみながら議論をする (30分) ◦ 議論の中で挙がったTODO を確認する (5分) 12
13
読書会やってよかったこと • 「生きた」学びを得て、活用できる ◦ 特に、社内のポストモーテムは障害原因から障害対応の 様子、再発防止策まで具体的なことが書いてある ◦ 具体的な内容の方が、学びを得たり改善に繋げやすい 14
読書会やってよかったこと ◦ インシデントの根本原因 ▪ 「この障害、自分達のプロダクトでも発生し得るのでは? 」 ◦ 障害対応のフロー・ドキュメント ▪ いいと思った所を真似する、アレンジして取り入れる
◦ インシデントの再発防止策 ▪ 先んじて調査・実施することで障害を未然に防ぐ 15
読書会で出たTODO • 障害対応のプロセスの改善 ◦ 障害対応ドキュメントテンプレート、Runbookの改善 ◦ メンテナンス時の考慮事項のドキュメント化 • 監視ルールの点検会 ◦
コンポーネントごとに監視が充足しているか点検する • etc… 16
17
18 ポストモーテム 読んで活用していきましょう