Upgrade to Pro — share decks privately, control downloads, hide ads and more …

1人目の専任SREがポストモーテム文化を改善したらエンジニア以外にも広まり、 他部門との連携も...

Hiroki Takatsuka
September 13, 2023

1人目の専任SREがポストモーテム文化を改善したらエンジニア以外にも広まり、 他部門との連携も強化された話+

Hiroki Takatsuka

September 13, 2023
Tweet

More Decks by Hiroki Takatsuka

Other Decks in Technology

Transcript

  1. 先に今日の発表のまとめ 3 • primeNumber社のポストモーテム文化を改善しました💪 • ポイントをふりかえると以下の2点に集約されそうです🙏 • まずは教科書通りに忠実にやる ◦ 守破離の「守」をやるイメージ

    ◦ 教科書は原典(GoogleのSRE本)にあたること • 組織で自走できる文化ができるまでは啓蒙・推進活動を積極的に行う ◦ 具体的にはポストモーテム作成、ふりかえりの設定とファシリテーター ◦ あれはよいものだ、と認識してもらえると担当者でやろうというムーブになっていく、はず
  2. 髙塚 広貴 (Hiroki Takatsuka) 株式会社primeNumber エンジニアリング本部 SRE 5 • ヤフー株式会社

    (2016 ~ 2022) ◦ CI/CDプラットフォーム Screwdriver.cd の SREチームのEMやスクラムマスターなど • 株式会社primeNumber (2022 ~ ) ◦ trocco®のSRE ◦ SREチームは現在2名 + 業務委託の方数名 • 猫 ◦ アル (アビシニアン ♂ 3歳半)
  3. ポストモーテムのGoogle Docs移行 + テンプレ更新 13 • 同時編集・コメント可能で社内でコラボレーションが容易なGoogle Docsを利用 ◦ GoogleのSRE本のChapter

    15 (Postmortem Culture: Learning from Failure) の通り ▪ > Real-time collaboration, An open commenting/annotation system, Email notifications • というか本で「俺たちはこれ使ってるぜ」と書かれているツールそのもの ▪ Google DocsはpN社で普段から利用していた • (前職ではBox Notesを使っていましたが、欲しい機能があり心理的にも導入コストが 低ければ何でもいいはず) • 基本的には SRE本やSRE Workbookに忠実にテンプレートを更新 ◦ 対応に関わっていない人でも読めば何が起こったか追えるよう項目を追加 ◦ 再発防止のためのアクションに優先度をつけるように ◦ 「インシデント対応からの学び」の項目を追加 などなど
  4. 「ポストモーテムふりかえり」の推進 17 • ポストモーテムをベースに議論・再発防止策を検討するミーティング ◦ これをprimeNumber社内では「ポストモーテムふりかえり」と呼んでいます • インシデント発生時、率先してポストモーテムふりかえりを開催+ファシリ • primeNumber社は他部署間の交流が活発

    • ポストモーテムに関してもエンジニア組織だけに閉じてしまうのはもったいな い、と感じ、エンジニア組織以外にも「ポストモーテムふりかえり」を推進 • 例えばテクニカルライターチームに推進した例 👉
  5. • 👍 インシデント対応フローに組み込まれ、対応担当者がポストモーテム作 成〜ふりかえりまで実施できている • 👍 対応フローの改善についてもポストモーテムふりかえりで話せている • 👍 (以前からできてますが)

    責任を個人ではなくチームのものにできている • 🙏 テンプレの改善 (改善の結果、形骸化してしまっている項目がある) • 🙏 再発防止アクションの履行をSREチームでwatchしている ◦ 「アクションが確実に実施されること」「実施できない場合に優先度・期日を変更した判断理由が書かれること」 現在のポストモーテム運用について個人的 Good👍 / Motto🙏 25
  6. まとめ 27 • primeNumber社のポストモーテム文化を改善しました💪 • ポイントをふりかえると以下の2点に集約されそうです🙏 • まずは教科書通りに忠実にやる ◦ 守破離の「守」をやるイメージ

    ◦ 教科書は原典(GoogleのSRE本)にあたること • 組織で自走できる文化ができるまでは啓蒙・推進活動を積極的に行う ◦ 具体的にはポストモーテム作成、ふりかえりの設定とファシリテーター ◦ あれはよいものだ、と認識してもらえると担当者でやろうというムーブになっていく、はず
  7. trocco®を一緒に創ってくれる方を探しています👀 • 海外展開に向けて面白い経験ができると思うのでぜひ🙏 ◦ trocco® SRE ◦ trocco® ソフトウェアエンジニア ◦

    セキュリティスペシャリスト ◦ その他募集一覧 👉 https://herp.careers/v1/primenumber • ゆるく交流しませんか?の会 pN meet up!@目黒 もやります🍻 ◦ 2023年9月29日(金)19:00~21:00 開催予定です! 28