Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Alerte, tout brûle ! Comment gérer des incident...

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.

Alerte, tout brûle ! Comment gérer des incidents techniques — Tech F'Est Nancy (2026-06-12)

🇫🇷 version below / version 🇫🇷 plus loin

This is the slide deck of a talk presented at the Tech F'Est conference in June 2026 in Nancy by Alexis "Horgix" Chotard about incident management. Pitch in French below.

Ceci est le deck de slides d'un talk présenté à la conférence Tech F'Est en juin 2026 à Nancy par Alexis "Horgix" Chotard sur le sujet de la gestion d'incident. Pitch ci-dessous.

Chez PayFit, malgré le côté "licorne scale-up", tout est loin d'être rose et plein de paillettes : en moyenne, sur les 6 derniers mois, nous avons un incident par jour — de gravité différente bien sûr.

Venez découvrir comment, en l'espace d'un an, nous sommes passé d'une culture où le mot "incident" n'existait même pas et où les problèmes soudains étaient cachés dans des board Jira obscurs, à aujourd'hui où nous nous sommes outillés et organisés pour les gérer sereinement et s'en servir comme leviers d'une démarche d'amélioration continue et de réduction de la dette technique.

Au programme :

- Évaluer la sévérité d'un incident
- Communiquer en interne
- Communiquer publiquement
- Mitigations, troubleshooting, et autre
- Outillage & automatisation
- Post-mortems
- Un mot sur l'astreinte

Vous ressortirez de ce talk avec un retour d'expérience concret sur la manière dont nous gérons nos incidents chez PayFit, et le chemin que nous avons parcouru pour en arriver à une approche saine et constructive, incluant bien sûr des idées et tips que vous pourrez appliquer chez vous si besoin !

Avatar for Horgix

Horgix

June 11, 2026

More Decks by Horgix

Other Decks in Technology

Transcript

  1. 1 28 juin 2024 Alexis “@Horgix” Chotard Alerte, tout brûle

    ! Comment gérer des incidents techniques Alerte, tout brûle ! Comment gérer des incidents techniques 12 juin 2026 Alexis “Horgix” Chotard Tech F’Est
  2. 2 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr SRE / Staff Engineer (et Maître Raclettier) ❤ Automatisation ❤ Rust ❤ Cloud Native ❤ Open Source @Horgix.fr Horgix Alexis “Horgix” Chotard Horgix
  3. 3 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 3 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Introduction Pourquoi ce talk ?
  4. 4 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 4 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Ophélie “Customer success” (support client) @PayFit
  5. 5 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 5 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Baloo Un client pas imaginaire … mais renommé !
  6. 6 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 6 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Baloo Un client pas imaginaire … mais renommé !
  7. 7 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 7 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Interaction : Support client PayFit ↔ Baloo
  8. 8 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 8 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr <Redacted> <Quelqu’un comme Ophélie> <Baloo> <Baloo> Interaction : Support client PayFit ↔ Baloo
  9. 9 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 9 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Notre objectif ? Éviter ce genre de situation !
  10. 10 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 10 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr
  11. 11 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 11 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr 🚨 Alerte 🚨 Il n’y a plus de café au Tech F’Est ☕ 😱
  12. 12 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 12 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr 🚨 Alerte 🚨 Il n’y a plus de café au Tech F’Est ☕ 😱 Maxime
  13. 13 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 13 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Spoiler : on va parler d’ Plusieurs fois. Mais plus tard pour de vrai.
  14. 14 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 14 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr La notion d’incident La notion d’incident → Humain & Organisation → Pratiques & Outils
  15. 15 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 15 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr « Un incident, c'est n'importe quoi qui vous éloigne de votre travail planifié avec un certain degré d'urgence » https://incident.io/guide/foundations/defining-an-incident
  16. 16 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Incident vs Bug ? Un lien éventuel, mais pas toujours
  17. 17 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Incident vs Maintenance planifiée ? Rien à voir !
  18. 18 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Faites confiance aux gens et à leur instinct/feeling Si quelqu'un pense qu'il y a un incident, c'est que c'est sûrement le cas
  19. 19 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Est-ce que notre incident en est vraiment un ? Maxime
  20. 20 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Est-ce que notre incident en est vraiment un ? Oui bien sûr ! Maxime
  21. 21 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 21 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Sévérité / Criticité « Si vous passez plus de temps à discuter de la sévérité de l'incident qu'à le résoudre, c'est un problème » https://incident.io/guide/foundations/severities
  22. 22 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Oubliez les matrices de sévérité & compagnie Durée d’impact ? ⏳ Fonctionnalités impactées ? 🧩 Part d’utilisateurs impactés ? 󰰁 Moment du jour/semaine/mois ? 📅
  23. 23 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Sévérité / Criticité SEV-1, SEV-2, SEV-3, SEV-4 Au jugé, favorisation à la hausse (+ revue)
  24. 24 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Quelle est la sévérité de notre manque de café ? Votez ! Maxime
  25. 25 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 25 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Prévenir Le meilleur incident c'est celui que l'on a pas.
  26. 26 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Tests de charge, Chaos Engineering, Canary release, … Mais aussi tests, mécanismes de retry, backpressure, … Le risque ne sera jamais à 0% pour autant :)
  27. 27 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 27 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Humain & Organisation La notion d’incident → Humain & Organisation → Pratiques & Outils
  28. 28 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 28 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Communiquer 📢 Se concentrer sur l’impact 💥 Orchestrer l’investigation 🪄 Prendre du recul 🔭
  29. 29 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Incident Commander Celui qui déclare l’incident, puis souvent → l’Engineering Manager de l’équipe la plus proche du problème
  30. 30 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Qui veut être commander sur notre incident ? Orchestrer les discussions Passer les annonces Informer … Maxime
  31. 31 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 31 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Adaptez le niveau de technicité aux interlocuteurs 📢 Soyez factuels et transparents 🪟 Faites preuve d’empathie 🫂 Donnez de la visibilité sur la suite ⏩ Répétez ♻ Restez zen :) 🧘
  32. 32 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr
  33. 33 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 33 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Rotation d’astreinte En l’absence de “follow the sun”, il faut quelqu’un qui puisse se réveiller !
  34. 34 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr
  35. 35 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 35 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Rotation d’astreinte L’organiser
  36. 36 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr
  37. 37 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Astreinte Équipe centralisée : ~6 personnes, exclusivement des SRE. Un jour, certaines équipes produit ?
  38. 38 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 38 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Pratiques & Outils Détection → Alerte → Communication & Troubleshooting → Résolution → Amélioration La notion d’incident → Humain & Organisation → Pratiques & Outils
  39. 39 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 39 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Détecter et s’organiser 🚨 Alerte & escalade 🧗
  40. 40 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr
  41. 41 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Alerting ▼ Datadog “Synthetics” ▼ Slack en journée, Incident.io la nuit ▼ Encore trop peu de métriques métier ▼ Channel partagé et ouvert avec toutes les alertes les plus critiques
  42. 42 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 42 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Propager l’information Publiquement, mais pas que
  43. 43 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr
  44. 44 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr
  45. 45 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr https://status.payfit.com
  46. 46 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Communiquer via les canaux classiques Emails, réseaux sociaux, etc. Bon courage pour convaincre vos département légaux & “branding” !
  47. 47 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Communication intégrée dans votre application Bannières, notifications, etc.
  48. 48 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Communiquer en interne Peu importe les canaux.
  49. 49 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 49 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr
  50. 50 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 50 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr S’améliorer Sur les incidents eux-mêmes … mais aussi sur leur gestion
  51. 51 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Mesurez MTTR (response / repair), moyens de détection, fréquence, temps passé, etc
  52. 52 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr
  53. 53 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr
  54. 54 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr
  55. 55 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 55 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr KCCNC → Hackathon → Live! → 💙
  56. 56 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 56 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Pas le temps pour une démo, mais…
  57. 57 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 57 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr
  58. 58 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 58 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr
  59. 59 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 59 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Take Away Les choses à retenir
  60. 60 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Take away ▼ Incident.io c'est génial. Foncez. ▼ Faites confiance aux gens et à leur instinct & capacités. ▼ Ayez de l'empathie. Que ça soit pour vos clients ou vos collègues (techniques ou non). Particulièrement le support client, ils en ont besoin ! ▼ Ayez une forme d’ “incident commanders” sur les incidents. ▼ Considérez les incidents d'un point de vue produit, pas juste technique. Impliquez & sensibilisez vos Product Owners/Managers ! ▼ Allez-y pas à pas et améliorez itérativement chaque étape du cycle d’un incident.
  61. 61 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr Vous êtes déjà en manque de café ? Rassurez-vous, Maxime est toujours là :) Et la pause café est juste après le super talk d’Antoine ! Maxime
  62. 62 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents

    techniques Alexis “Horgix” Chotard @Horgix.fr 62 2026-06-12 Alerte, tout brûle ! Comment gérer des incidents techniques Alexis “Horgix” Chotard @Horgix.fr Merci ! Et bon courage à ceux qui sont d’astreinte ce soir 🙂
  63. 63 28 juin 2024 Alexis “@Horgix” Chotard Alerte, tout brûle

    ! Comment gérer des incidents techniques Alerte, tout brûle ! Comment gérer des incidents techniques 12 juin 2026 Alexis “Horgix” Chotard Q&A Votre feedback compte Merci ! Profitez en, je dois partir juste après le talk… Slides → https://bsky.app/profile/Horgix.fr Tech F’Est <REDACTED> Il fallait être là pendant la conférence :)