Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
インシデントコマンダーやってみた
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Hayato Kawai
February 22, 2024
5
1.2k
インシデントコマンダーやってみた
「ゆるSRE勉強会 #4」の LT 資料です。
https://yuru-sre.connpass.com/event/306649/
Hayato Kawai
February 22, 2024
Tweet
Share
More Decks by Hayato Kawai
See All by Hayato Kawai
Amazon Bedrock のコスト内訳を気合でトラッキングする
fohte
0
70
Bedrock のコスト監視設計
fohte
2
550
Data Access Control で実現するより細かい権限制御
fohte
0
360
Datadog が支える Wantedly のシステム運用
fohte
0
120
Devin や Cursor などの生成 AI ツール導入に向けて何を取り組んだのか
fohte
2
340
Datadog Network Monitoring を活用して NAT Gateway 課金を 80 % 削減した話
fohte
2
780
Trace Metrics と Istio Metrics でサービス健全性を監視する
fohte
0
540
段階的リリースを実現する kube canary
fohte
1
240
巨大 tfstate に立ち向かう技術
fohte
1
1.3k
Featured
See All Featured
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
My Coaching Mixtape
mlcsv
0
63
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
280
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
140
Information Architects: The Missing Link in Design Systems
soysaucechin
0
810
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
82
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
370
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.7k
Discover your Explorer Soul
emna__ayadi
2
1.1k
Why Our Code Smells
bkeepers
PRO
340
58k
The Invisible Side of Design
smashingmag
302
51k
Transcript
© 2024 Wantedly, Inc. インシデントコマンダーやってみた ゆるSRE勉強会 #4 2024-02-22 Hayato Kawai
(@fohte)
© 2024 Wantedly, Inc. あなた誰 名前: @fohte (ふぉーて) 川井 颯人
(Hayato Kawai) 所属: ウォンテッドリー株式会社 趣味: 🎮 🎹
© 2024 Wantedly, Inc. 障害対応どうしてますか?
© 2024 Wantedly, Inc. 今日伝えたいこと • 障害対応訓練には価値がある ◦ 障害対応訓練によってインシデント対応のハードルが下がった ◦
インシデントコマンダーもやればできる
© 2024 Wantedly, Inc. ウォンテッドリーの障害対応文化 https://speakerdeck.com/irotoris/wantedly-incident-commander
© 2024 Wantedly, Inc. 三行まとめ • 障害対応の Slack #war_room に通知がくると
わらわらと人が集まる • 失敗を許す文化 • インシデントコマンダーは難しいので備えよう
© 2024 Wantedly, Inc. エスカレーションフロー システム ユーザー カスタマーサポート プロダクト開発チーム /基盤チーム
オンコール担当 #war_room #alert 重大なアラートの み PD へ 問題が大きい 場合はエスカレ/招集
© 2024 Wantedly, Inc. 障害対応の心構え - Wantedly Engineering Hanbook https://docs.wantedly.dev/introduction/incident
© 2024 Wantedly, Inc. 現状の課題 • インシデントコマンダーを やる人が固定化されている ◦ 長く在籍
&& コンテキスト理解が深いメン バーが対応している ◦ 開発チームでインシデントコマンダーがで きる人は 1 割ほど ▪ 障害対応の経験自体が全体の 3 割ほ ど
© 2024 Wantedly, Inc. 障害対応訓練はじめました • 障害対応訓練の取り組みを始めました ◦ 年末、2 月で現在
2 回開催。今後も毎月開催予定 ◦ この障害対応訓練でインシデントコマンダーをやってみた
© 2024 Wantedly, Inc. 障害対応訓練でインシデントコマンダーやりました • インシデントコマンダーはなにをやる? ◦ 対応メンバーの招集 ▪
(障害訓練ではあらかじめすでに集まっている ) ◦ やるべきこと判断 ▪ 何から進めるか ▪ どこを調べていくか ▪ どう対応するか ◦ 対応メンバーに対する、役割・仕事のアサイン ▪ 例: ユーザーアナウンスは xx さんに任せました ▪ 例: 今手空いている人は ? => xx さんにこのあたりを調べてほしい ▪ メンバーには対応に集中してもらえるようにする
© 2024 Wantedly, Inc. 障害対応訓練の感想 • 👍 障害対応のハードルが下がった ◦ 今まで:
出る幕がなさそうと感じていた ▪ 詳しそうなメンバーが集まっているし … ▪ 自分が何手伝えるのか分からないし … ◦ 今: 自分も役に立てる & 何やれば良いかが分かった ▪ 他メンバーからも同様の感想をもらった • 🤔 リモートだと混線する ◦ Slack huddle で対応者が集まって通話している ◦ 同時に 1 つの話題しか話せない
© 2024 Wantedly, Inc. 障害対応訓練でインシデントコマンダーやった感想 • 👍 意外とできる ◦ 本番でもできそう
• 🤔 自分で手を動かしてしまう ◦ 🤔 障害対応メンバーの中で自分が詳しい領域は、自分で手を動かしてしまう ◦ => こうなったらインシデントコマンダーを他の人にパスする のが良さそう
© 2024 Wantedly, Inc. 今日伝えたいこと • 障害対応訓練には価値がある ◦ その障害訓練によってインシデント対応のハードルが下がった ◦
インシデントコマンダーもやればできる
© 2024 Wantedly, Inc. https://www.wantedly.com/projects/522096