Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Анатомия ошибки

Sergey Vysotskiy
November 05, 2012
290

Анатомия ошибки

В разработке програмного обеспечения мы работаем со сложными системами. В них не самые тривиальные технологии переплетаются со сложными процессами, и это только начало. Зачастую это означает, что, когда все ломается, не всегда очевидно, почему произошла ошибка, и что можно сделать, чтобы хоть чему-то из этой ошибки научиться. Как проводить пост мортем? Почему происходят ошибки? Как сделать нашу работу надежнее и безопаснее? Чему мы можем научиться из авиакатастроф и аварий на объектах мирного атома?

Подробнее тут: http://goblingame.blogspot.ru/2012/10/blog-post_12.html

Sergey Vysotskiy

November 05, 2012
Tweet

Transcript

  1. Высоцкий сергей Высоцкий сергей Специалист по Тестированию Специалист по Тестированию

    Высоконагруженных Высоконагруженных Сервисов, 2GIS Сервисов, 2GIS http://goblingame.blogspot.com/ http://goblingame.blogspot.com/ [email protected] [email protected] @goblingame @goblingame
  2. 0. Контекст 0. Контекст 1. как? 1. как? 2. почему?

    2. почему? 3. что делать? 3. что делать?
  3. 0. Контекст 0. Контекст 1. как? 1. как? 2. почему?

    2. почему? 3. что делать? 3. что делать?
  4. Отказоустойчивость Отказоустойчивость социотехнических социотехнических систем систем Доктор Кук Доктор Кук

    Доктор Деккер Доктор Деккер Доктор Холлнагель Доктор Холлнагель Доктор Вудс Доктор Вудс
  5. Наша система: Наша система: софт - софт - железо -

    железо - люди - люди - процессы - процессы - сеть - сеть -
  6. Наша система: Наша система: софт - софт - железо -

    железо - люди - люди - процессы - процессы - сеть - сеть -
  7. Система, рассчитанная Система, рассчитанная На идеальную работу На идеальную работу

    Каждого звена, Каждого звена, Обречена на провал Обречена на провал
  8. Нормы, процедуры, Нормы, процедуры, инструкции инструкции оператор оператор Ресурсы, Ресурсы,

    ограничения ограничения ошибки ошибки компенсации компенсации коррективы коррективы нарушения нарушения
  9. 0. Контекст 0. Контекст 1. как? 1. как? 2. почему?

    2. почему? 3. что делать? 3. что делать?
  10. 0. Контекст 0. Контекст 1. как? 1. как? 2. почему?

    2. почему? 3. что делать? 3. что делать?
  11. Основное правило: «Основное правило: « любое объяснение любое объяснение лучше

    его отсутствия» лучше его отсутствия» ницше - ницше - про root cause analysis про root cause analysis
  12. Ошибка ретроспекции Ошибка ретроспекции Знание результата «Знание результата « Влияет

    на анализ Влияет на анализ произошедшего» произошедшего»
  13. Ошибка ретроспекции Ошибка ретроспекции Надо было быть Надо было быть

    внимательнее внимательнее Все видно как на Все видно как на Ладони, Как ты мог Ладони, Как ты мог проморгать? проморгать?
  14. Отклонение в сторону Отклонение в сторону результата результата Суждение о

    решениях «Суждение о решениях « По их окончательному По их окончательному результату» результату»
  15. На самом деле На самом деле база база Вебсервер Вебсервер

    Кэш Кэш балансировщик Админ Попал в аварию Админ Попал в аварию
  16. На самом деле На самом деле база база Вебсервер Вебсервер

    Кэш Кэш балансировщик Админ Попал в аварию Админ Попал в аварию Все На devday Все На devday
  17. На самом деле На самом деле база база Вебсервер Вебсервер

    Кэш Кэш балансировщик Админ Попал в аварию Админ Попал в аварию Все На devday Все На devday Проблемы С наймом Проблемы С наймом
  18. На самом деле На самом деле база база Вебсервер Вебсервер

    Кэш Кэш балансировщик Админ Попал в аварию Админ Попал в аварию Все На devday Все На devday Проблемы С наймом Проблемы С наймом Бюджет Сдали вчера Бюджет Сдали вчера
  19. На самом деле На самом деле база база Вебсервер Вебсервер

    Кэш Кэш балансировщик Админ Попал в аварию Админ Попал в аварию Все На devday Все На devday Почта лежит Почта лежит Проблемы С наймом Проблемы С наймом Бюджет Сдали вчера Бюджет Сдали вчера
  20. На самом деле На самом деле база база Вебсервер Вебсервер

    Кэш Кэш балансировщик Админ Попал в аварию Админ Попал в аварию Маркетинг Написал статью Маркетинг Написал статью Все На devday Все На devday Почта лежит Почта лежит Проблемы С наймом Проблемы С наймом Бюджет Сдали вчера Бюджет Сдали вчера
  21. На самом деле На самом деле база база Вебсервер Вебсервер

    Кэш Кэш балансировщик Админ Попал в аварию Админ Попал в аварию Маркетинг Написал статью Маркетинг Написал статью Все На devday Все На devday Почта лежит Почта лежит Проблемы С наймом Проблемы С наймом Бюджет Сдали вчера Бюджет Сдали вчера
  22. Нет первопричин, есть лишь Нет первопричин, есть лишь мНого благоприятствующих

    мНого благоприятствующих Ошибке факторов Ошибке факторов
  23. 0. Контекст 0. Контекст 1. как? 1. как? 2. почему?

    2. почему? 3. что делать? 3. что делать?
  24. Прогнозирование чего ждать? | Прогнозирование чего ждать? | Превентивные меры

    Превентивные меры Мониторинг куда смотреть? | Мониторинг куда смотреть? |
  25. Прогнозирование чего ждать? | Прогнозирование чего ждать? | Превентивные меры

    Превентивные меры Мониторинг куда смотреть? | Мониторинг куда смотреть? | Ответные меры что делать? | Ответные меры что делать? |
  26. Прогнозирование чего ждать? | Прогнозирование чего ждать? | Превентивные меры

    Превентивные меры Мониторинг куда смотреть? | Мониторинг куда смотреть? | Ответные меры что делать? | Ответные меры что делать? | обучение что это было? | обучение что это было? |
  27. Прогнозирование чего ждать? | Прогнозирование чего ждать? | Превентивные меры

    Превентивные меры Мониторинг куда смотреть? | Мониторинг куда смотреть? | Ответные меры что делать? | Ответные меры что делать? | обучение что это было? | обучение что это было? |
  28. Ошибка это... Ошибка это... Тезис 1 # Тезис 1 #

    Частный случай успеха Частный случай успеха
  29. Разбираем ошибки Разбираем ошибки 1 случай из 10 1 случай

    из 10 Масштабируем на все релизы Масштабируем на все релизы
  30. успех это... успех это... Тезис 2 # Тезис 2 #

    Частный случай ошибки Частный случай ошибки
  31. Разбираем успехи Разбираем успехи 9 случаев из 10 9 случаев

    из 10 Масштабируем на все релизы Масштабируем на все релизы
  32. Изменение на любом уровне Изменение на любом уровне Может породить

    новые Может породить новые уязвимости уязвимости