Upgrade to Pro — share decks privately, control downloads, hide ads and more …

すこやかなサービス運営のための PWG (Performance Working Group)

すこやかなサービス運営のための PWG (Performance Working Group)

2024-08-10 builderscon 2024

Takafumi ONAKA

August 10, 2024
Tweet

More Decks by Takafumi ONAKA

Other Decks in Technology

Transcript

  1. 自己紹介 • 大仲 能史 a.k.a. id:onk • 芸歴20年目 • 株式会社はてな

    ◦ チーフエンジニア ◦ Mackerel 開発チーム 2
  2. SRE本 31章 14 • プロダクション環境において予定されてい る変更 • メトリクス • 障害

    • ページされたイベント • ページされなかったイベント • これまでのアクションアイテム
  3. PWGの開催頻度と出席者 • 月次開催、1時間枠 • 出席者 ◦ 必須: SREs ◦ 必須:

    バックエンドのテックリード ◦ 任意: アプリケーションエンジニア ◦ 任意: プロダクトオーナー 19 必須メンバーが揃わない場合はリスケする
  4. PWGでの役割 • 司会 ◦ 画面を写す ◦ 進行 ▪ 話題ごとに適切な人に話 を振る

    • 書記 ◦ 会話した内容を議事録 (共同編集可) に書き記す 20 • その他みんな ◦ 答えたり質問したり ▪ 初心者大歓迎 ◦ 書記が書き逃したこと を書く ◦ 気になりがあったら書 く ▪ 事前記入大歓迎
  5. PWGのアジェンダ • 障害ふりかえり • 作業ログ • アラート • ダッシュボード 22

    • 今日話したいこと • 今後の変化共有 • 出たTODOのIssue化 • 感想/雑談
  6. アラート確認コーナー • Mackerelのアラート一覧を眺める ◦ それぞれがなぜ発生しているのかを話す • 対応していないアラートがあったら ◦ そもそも不要なアラートじゃないか会話する ◦

    その場で閾値を変えたり、監視ごと消したり • 頻出しているアラートがあったら ◦ 必要なアラートなら根本対応を検討する 25
  7. PWGのアジェンダ • 障害ふりかえり • 作業ログ • アラート • ダッシュボード 28

    • 今日話したいこと • 今後の変化共有 • 出たTODOのIssue化 • 感想・雑談
  8. PWGのアジェンダ 29 • 今日話したいこと ◦ なんか気になってることが集まってくる ◦ 特に無いこともある • 今後の変化共有

    ◦ 大型のキャンペーンがあってアクセスが増えるとか ◦ インフラ構成を変える予定とかEOLとか
  9. • 出たTODOのIssue化 ◦ Issueにして終わる ◦ その場で書き切れなかったら書く人をアサインする ◦ Issueの優先度はリファインメント時に相談 • 感想・雑談

    ◦ 会のアジェンダ自体もどんどん変えていく ◦ 議事録に置いておくとフンワリした話題を拾いやすい PWGのアジェンダ 30
  10. POが参加している • 数字の変動要因をより知っている ◦ サービス内のイベントや変化 ◦ 数字の変化が予期されたものか、一時的か恒久的か ◦ 例: CM放映による新規ユーザー増加とその影響

    • 未来の見通しも議論可能 ◦ 利用状況のトレンドや今後の開発予定を共有 ◦ スケールアップ等の対応を判断 33 https://www.minemura-coffee.com/entry/2023/12/06/194050
  11. まとめ 43 • PWGを行うことで、チーム全員の認識が揃う ◦ SLO、各コンポーネントの強弱、最近の傾向 • ダッシュボードをみんなで見る ◦ 継続して見ているだけで解像度が上がっていく

    • ダッシュボードや監視が、育てていくものに ◦ 特定の人/職種じゃなく、チームで育てていく • チームでSLOや監視と向き合おう