Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SLOを活用した技術的改善

 SLOを活用した技術的改善

株式会社タイミーではスキマバイトプラットフォームを開発・運用しています。サービスもリリースして3年を超え、"負債"と呼ばれるものが増えてきました。一方でビジネス的に開発したいものは後を絶ちません。そこで開発チームでSLOを制定し、サービスの健全な状態を測定・監視することで「システムが健全にサービス提供できているか」を調べ、必要なときに必要な改修を行えるようにしました。本セッションでは弊社のSLOの解釈や利用方法を伝えるとともに、実際に感じたメリットや行われた技術的改善を紹介します。

セッション動画
https://www.youtube.com/watch?v=VburNEFcg64

@ジュジュ

September 30, 2021
Tweet

More Decks by @ジュジュ

Other Decks in Technology

Transcript

  1. 解決策2: 現場の意見はすべて即実行する - メリット - よく気づく社員が疲弊しない - 問題が深化する前に解決できる - デメリット

    - 適切な優先度判断がなされない - 全エンジニアがPM的な視点を持たなければならない - 妥当な説明が社内に残りにくい
  2. 解決策2: 現場の意見はすべて即実行する - メリット - よく気づく社員が疲弊しない - 問題が深化する前に解決できる - デメリット

    - 適切な優先度判断がなされない - 全エンジニアがPdM/PjM的な視点を持たなければなら ない - 妥当な説明が社内に残りにくい
  3. SLO/Error Budget SLO (Service Level Objective) サービスを運用する上で守るべき基準値 ex. /hoge APIは99.95%で正常なレスポンスを返却する

    Error Budget 事実とSLOの間にある余裕 ex. SLOが99.95%に対して事実99.97%であれば40%(0.02%分)の エラーバジェットがある
  4. まとめ - 技術的改善の問題はエンジニアリングじゃないところにありが ち - 合意形成 - 放置するとよく気づく人が疲弊する - 技術的改善にはSLOを使うと便利

    - 意思決定コストを前払いしているので、エンジニアにとって は気が楽 - 責任をチームに持たせるので属人性も撤廃