Upgrade to Pro — share decks privately, control downloads, hide ads and more …

スタートアップでポストモーテムを4年で200回やって得た学び

Avatar for Hiroaki KARASAWA Hiroaki KARASAWA
April 24, 2025
7

 スタートアップでポストモーテムを4年で200回やって得た学び

Avatar for Hiroaki KARASAWA

Hiroaki KARASAWA

April 24, 2025
Tweet

Transcript

  1. 株式会社 ダイニー © 2025 Dinii Inc. ※こちらの枠内に詳細や、画像を記載/貼り付けしてください。 白枠は、必要に応じて消していただいても大丈夫です。 @karszawa Introduction

    Hiroaki KARASAWA (karszawa) 株式会社ダイニー VP of Technology Google Champion Innovator → Google Developer Experts (Modern Architecture, Serverless Application, Data) 明日から6連休 🗽 自己紹介
  2. 株式会社 ダイニー © 2025 Dinii Inc. Introduction トラブル対応のすべて、と題したが日常的な 対応から緊急事態の対応まですべてを20分 で説明し切るのは無理だった。

    SRE Lounge #17 実際に発生した大規模障害とそこから得られ た学びについて。全文非公開。 Incident Response Meetup #2 TypeScript について話すこともある。 noren.ts @karszawa 最近の登壇
  3. 株式会社 ダイニー © 2025 Dinii Inc. 01 02 03 04

    05 ダイニーについて インシデント関連の取り組みの全体像 日常的なトラブルに対処するワークフロー ポストモーテムを成功させるには さいごに @karszawa
  4. 株式会社 ダイニー © 2024 Dinii Inc. 飲食店の売上UPに貢献する唯一無二のスーパーモバイルPOS オペレーションなしで 売上UP! AIと専属スタッフにお任せ

    お客様を 自動で会員化 自動販促 メッセージ アンケート 自動回収 店員への チップ/投げ銭 圧倒的な 使いやすさで 客単価UP ロイヤルティ プログラム 顧客情報を 接客に活用
  5. 株式会社 ダイニー © 2025 Dinii Inc. ダイニーについて @karszawa 【大前提】ダイニーは POS

    を開発している 1. POS は金夜ピークの飲食店でもスムーズに使える必要がある 2. POS は一日何時間も使われる 3. POS は老若男女どんな従業員にも使われる 4. POS は使えないなら使わないで済むプロダクトではない → ダイニーは、極めて分かりやすく、スムーズに稼働するプロダクトでなければならない ダイニーにおけるインシデントハンドリングの重要性 「トラブルがないこと」 はそのための第一歩
  6. 株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー @karszawa ポストモーテムの観点 当日の対応が妥当であったか

    そもそもユーザーに影響を 与えないためには何ができたか ポストモーテムで見るべきこと ① ポストモーテムで見るべきこと ②
  7. 株式会社 ダイニー © 2025 Dinii Inc. @karszawa 件数・スコア等の集計値 インシデントレポートへの リレーション

    (これがあるから Notion は最高) 業務影響度 影響店舗数 原因カテゴリ スコア(参考値) スコア(確定値)
  8. 株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー インシデントのフォーマットに従っていない ため調査のための情報が埋められていない 調査のための情報の不足

    伴って、適切な温度感で対応ができない イラストこれで合ってる? 業務影響度が分からない 正しいデータベースに存在しないため 振り返りが漏れることになる 振り返りができない @karszawa インシデントとして扱われないことの弊害
  9. 株式会社 ダイニー © 2025 Dinii Inc. ポストモーテムを成功させるには @karszawa 1. 判断に恣意性を持ち込まない、すべてを機械的に処理する

    🤖 2. 人の判断を持ち込むから「判断の良し悪し」の話になる 🙅 [1] 対象を恣意的に選別しない 緊急性の高低 発生日時 が現在時刻の 一時間以内 であれば緊急性が 高い ダイニーでは
  10. 株式会社 ダイニー © 2025 Dinii Inc. ポストモーテムを成功させるには @karszawa 発生抑止 1.

    既定のリリースフローに則っていたか 2. テストは実施されていたか 事後対応 1. 初動までの速度は適切か 2. 影響範囲をどのように確かめたか 3. 顧客への連絡は適切な頻度で実施されていたか [2] 一定のチェックポイントで振り返りを行う 改善できる箇所をチェックポイントにする ポイント 改善のための活動なのだから 改善できる箇所に着目すれば良い
  11. 株式会社 ダイニー © 2025 Dinii Inc. ポストモーテムを成功させるには 資@karszawa いわゆる Blameless

    な分化 [3] 人ではなくプロセスに注目する チェックポイントごとの判断をしていれば必然的にそうなる あまり意識的にやっている訳では無いが自然とそうなっている ダイニーでは
  12. 株式会社 ダイニー © 2025 Dinii Inc. @karszawa さいごに 募集の背景 1.

    会社としてインシデントハンドリングの重要性を認知している 2. むしろインシデントハンドリングの巧拙が事業強度に繋がるとすら考えている 3. 組織的なインシデントハンドリングのレベル向上のため専任のポジションを設けている SRE (Incident Management) を募集中!
  13. 株式会社 ダイニー © 2025 Dinii Inc. さいごに @karszawa ダイニーにおける日常的なトラブル対応のフローとポストモーテムの実施方法について紹介しました まとめ

    「プロセスに人の判断を持ち込むな」 「一定のリズムで振り返りを実施せよ」 ポストモーテムのポイント ① ポストモーテムのポイント ②