Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Liz fong-Jones - Production Excellence
Search
DevOpsDays GDL
February 21, 2020
Technology
0
300
Liz fong-Jones - Production Excellence
DevOps Days GDL 2020 - February 20th
DevOpsDays GDL
February 21, 2020
Tweet
Share
More Decks by DevOpsDays GDL
See All by DevOpsDays GDL
Julian Limon - Aligned autonomy: How clarity on outcomes gets us to self-organized teams that win
devopsdaysgdl
0
450
Jorge Castro - Building DevOps Ways of Working at large Enterprise through learning, collaboration and Gamification experiences: Continuous WoWs, DevUps and Feedback
devopsdaysgdl
0
300
Salvador Elizarraras - Five Ways to Improve Team Performance
devopsdaysgdl
0
200
Tommy Adams - Cutting the Cord: Letting Your Remote Team Run Free
devopsdaysgdl
0
210
Leoswaldo Macias - Protecting your App in the Cloud
devopsdaysgdl
0
270
Cameron Motevasselani - Extending Spinnaker for the Enterprise
devopsdaysgdl
0
260
Jesus Contreras - Containers y DevTools en AWS
devopsdaysgdl
0
260
Mofizur Rahman - Knative: Serverless Computing on Kubernetes
devopsdaysgdl
0
320
Ra Acosta - SAFe Journey 5.0
devopsdaysgdl
0
210
Other Decks in Technology
See All in Technology
podman_update_2024-12
orimanabu
1
270
サイバー攻撃を想定したセキュリティガイドライン 策定とASM及びCNAPPの活用方法
syoshie
3
1.2k
サーバレスアプリ開発者向けアップデートをキャッチアップしてきた #AWSreInvent #regrowth_fuk
drumnistnakano
0
190
レンジャーシステムズ | 会社紹介(採用ピッチ)
rssytems
0
150
GitHub Copilot のテクニック集/GitHub Copilot Techniques
rayuron
33
13k
ガバメントクラウドのセキュリティ対策事例について
fujisawaryohei
0
530
オプトインカメラ:UWB測位を応用したオプトイン型のカメラ計測
matthewlujp
0
170
Qiita埋め込み用スライド
naoki_0531
0
4.8k
TSKaigi 2024 の登壇から広がったコミュニティ活動について
tsukuha
0
160
非機能品質を作り込むための実践アーキテクチャ
knih
3
1.2k
LINEヤフーのフロントエンド組織・体制の紹介【24年12月】
lycorp_recruit_jp
0
530
成果を出しながら成長する、アウトプット駆動のキャッチアップ術 / Output-driven catch-up techniques to grow while producing results
aiandrox
0
290
Featured
See All Featured
XXLCSS - How to scale CSS and keep your sanity
sugarenia
247
1.3M
Building Your Own Lightsaber
phodgson
103
6.1k
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
Six Lessons from altMBA
skipperchong
27
3.5k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
229
52k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
Agile that works and the tools we love
rasmusluckow
328
21k
Site-Speed That Sticks
csswizardry
2
190
GitHub's CSS Performance
jonrohan
1030
460k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.2k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
28
900
Transcript
Detangling complex systems Liz Fong-Jones @lizthegrey #DevOpsDaysGDL February 21, 2020
with compassion & production excellence 1 Illustrated by @emilywithcurls!
Entender sistemas complejos Liz Fong-Jones @lizthegrey #DevOpsDaysGDL el 21 de
febrero, 2020 con compasión & excelencia de producción 2 Ilustrada por @emilywithcurls!
@lizthegrey en #DevOpsDaysGDL We write code to solve problems. 3
Como ingenieros, solucionamos problemas.
@lizthegrey en #DevOpsDaysGDL But our job isn't done upon commit.
4 Hay más trabajo después del commit.
@lizthegrey en #DevOpsDaysGDL Production is increasingly complex. 5 La producción
es más compleja.
@lizthegrey en #DevOpsDaysGDL It's harder to understand our systems. 6
Entender los sistemas es más difícil.
@lizthegrey en #DevOpsDaysGDL What does uptime mean? 7 Que significa
tiempo útil?
@lizthegrey en #DevOpsDaysGDL Is it measured in servers? 8 Se
mide por servidores?
@lizthegrey en #DevOpsDaysGDL Is it measured in complaints? 9 Se
mide por quejas?
@lizthegrey en #DevOpsDaysGDL How about juggling everything else? 10 Cómo
podemos hacer todo lo demás?
@lizthegrey en #DevOpsDaysGDL Our strategies need to evolve. 11 Tenemos
que usar otras estrategias.
@lizthegrey en #DevOpsDaysGDL Don't "buy" DevOps. No "compres" DevOps 12
@lizthegrey en #DevOpsDaysGDL When we order the alphabet soup... 13
Cuando pedimos la sopa de letras...
@lizthegrey en #DevOpsDaysGDL Noisy alerts. Grumpy engineers. 14 Despertamos con
frecuencia.
@lizthegrey en #DevOpsDaysGDL Walls of meaningless dashboards. 15 No sabemos
dónde mirar.
@lizthegrey en #DevOpsDaysGDL Incidents take forever to fix. 16 No
podemos reparar rápidamente.
@lizthegrey en #DevOpsDaysGDL Everyone bugs the "expert". 17 Todo el
equipo molesta al experto.
@lizthegrey en #DevOpsDaysGDL Deploys are unpredictable. 18 No podemos desplegar
con confianza.
@lizthegrey en #DevOpsDaysGDL There's no time to do projects... 19
No hay horas en el día para proyectos.
@lizthegrey en #DevOpsDaysGDL and when there's time, there's no plan.
20 y no sabemos qué debemos hacer.
@lizthegrey en #DevOpsDaysGDL The team is struggling to hold on.
21 No podemos aguantar esto.
@lizthegrey en #DevOpsDaysGDL What are we missing? 22 Qué nos
hemos perdido?
@lizthegrey en #DevOpsDaysGDL We forgot who operates systems. 23 Hemos
olvidado quién opera los sistemas.
@lizthegrey en #DevOpsDaysGDL Tools aren't magical. 24 Las herramientas no
son mágicas.
@lizthegrey en #DevOpsDaysGDL Invest in people, culture, & process. 25
Inviertas en tu gente, cultura, y procesas.
@lizthegrey en #DevOpsDaysGDL Enter the art of Production Excellence. 26
Necesitamos Excelencia de Producción.
@lizthegrey en #DevOpsDaysGDL Make systems more reliable & friendly. 27
Cree sistemas más confiable y amigable.
@lizthegrey en #DevOpsDaysGDL ProdEx takes planning. 28 Se necesita planear
para ProdEx.
@lizthegrey en #DevOpsDaysGDL Measure and act on what matters. 29
Midas y correjas lo más importante.
@lizthegrey en #DevOpsDaysGDL Incluyas a todos. Involve everyone. 30
@lizthegrey en #DevOpsDaysGDL Encourage asking questions. 31 Recompenses haciendo preguntas.
@lizthegrey en #DevOpsDaysGDL How do we get started? 32 Cómo
podemos empezar?
@lizthegrey en #DevOpsDaysGDL Know when it's too broken. 33 Tenemos
que saber cuándo está muy malo.
@lizthegrey en #DevOpsDaysGDL & be able to debug, together when
it is. 34 y poder depurar, juntos, cuando está malo.
@lizthegrey en #DevOpsDaysGDL Eliminate (unnecessary) complexity. 35 Tenemos que eliminar
la complejidad.
@lizthegrey en #DevOpsDaysGDL Our systems are always failing. 36 Los
sistemas siempre fallan.
@lizthegrey en #DevOpsDaysGDL What if we measure too broken? 37
Podemos medir las fallas.
@lizthegrey en #DevOpsDaysGDL We need Service Level Indicators 38 Necesitamos
Indicadores del Nivel de Servicio.
@lizthegrey en #DevOpsDaysGDL SLIs and SLOs are common language. 39
SLIs y SLOs son idioma común.
@lizthegrey en #DevOpsDaysGDL Think in terms of events in context.
40 Consideramos los eventos y sus contextos.
@lizthegrey en #DevOpsDaysGDL Is this event good or bad? 41
Cómo sabemos si un evento es malo?
@lizthegrey en #DevOpsDaysGDL Are users grumpy? Ask your PM. 42
Hay quejas? El gerente de producto saberá.
@lizthegrey en #DevOpsDaysGDL What threshold buckets events? 43 Cuál es
el umbral entre lo bueno y lo malo?
@lizthegrey en #DevOpsDaysGDL HTTP Code 200? Latency < 300ms? 44
El código HTTP 200? Latencia < 300ms?
@lizthegrey en #DevOpsDaysGDL How many eligible events did we see?
45 Cuántos eventos elegibles medimos?
@lizthegrey en #DevOpsDaysGDL Availability: Good / Eligible Events 46 La
disponibilidad = Buenos / Elegibles
@lizthegrey en #DevOpsDaysGDL Set a target Service Level Objective. 47
Establezcas un Objetivo.
@lizthegrey en #DevOpsDaysGDL Use a window and target percentage. 48
Tiene una ventana temporal y proporción.
@lizthegrey en #DevOpsDaysGDL 99.9% of events good in past 30
days. 49 99.9% de eventos del mes pasado serán buenos.
@lizthegrey en #DevOpsDaysGDL A good SLO barely keeps users happy.
50 Apenas mantiene contentos al cliente.
@lizthegrey en #DevOpsDaysGDL Drive alerting with SLOs. 51 Se puede
usar SLOs para alertar.
@lizthegrey en #DevOpsDaysGDL Error budget: allowed unavailability 52 El presupuesto
de errores permitidos.
@lizthegrey en #DevOpsDaysGDL How long until I run out? 53
Cuánto tiempo hasta se acabe?
@lizthegrey en #DevOpsDaysGDL Page if it's hours. 54 Ticket if
it's days. Envíe una alerta si tardará horas. Cree una tarea si tardará días.
@lizthegrey en #DevOpsDaysGDL 55 Tenemos un gran problema. Uh oh,
better wake someone up.
@lizthegrey en #DevOpsDaysGDL Data-driven business decisions. 56 Decidas utilizando datos.
@lizthegrey en #DevOpsDaysGDL Is it safe to do this risky
experiment? 57 Es seguro probar esto?
@lizthegrey en #DevOpsDaysGDL Should we invest in more reliability? 58
Debemos invertir en más confiabilidad?
@lizthegrey en #DevOpsDaysGDL Perfect SLO > Good SLO >>> No
SLO 59 Lo perfecto es enemigo de lo bueno.
@lizthegrey en #DevOpsDaysGDL Measure what you can today. 60 Midas
lo que puedes hoy.
@lizthegrey en #DevOpsDaysGDL Iterate to meet user needs. 61 Seas
flexible y cambias con necesidades.
@lizthegrey en #DevOpsDaysGDL Only alert on what matters. 62 Sólo
reciba alertas cuando es necesario.
@lizthegrey en #DevOpsDaysGDL SLIs & SLOs are only half the
picture... 63 SLIs sólo son la mitad de la solución...
@lizthegrey en #DevOpsDaysGDL Our outages are never identical. 64 Los
cortes nunca son los mismos.
@lizthegrey en #DevOpsDaysGDL Failure modes can't be predicted. 65 No
podemos saber cómo va a fallar.
@lizthegrey en #DevOpsDaysGDL Tenemos que depurar fallas nuevas. 66 Debug
novel cases. In production.
@lizthegrey en #DevOpsDaysGDL Dive into data to ask new questions.
67 Formules preguntas nuevas con datos.
@lizthegrey en #DevOpsDaysGDL Allow forming & testing hypotheses. 68 Tenemos
que probar las hipótesis.
@lizthegrey en #DevOpsDaysGDL Our services must be observable. 69 Necesitamos
observabilidad.
@lizthegrey en #DevOpsDaysGDL Can you examine events in context? 70
Conoces los eventos y sus contextos?
@lizthegrey en #DevOpsDaysGDL Can you explain the variance? 71 Puedes
explicar las diferencias?
@lizthegrey en #DevOpsDaysGDL using relevant dimensions? 72 con las dimensiones
pertinentes?
@lizthegrey en #DevOpsDaysGDL Can you mitigate impact & debug later?
73 Puedes reparar antes y depurar después?
@lizthegrey en #DevOpsDaysGDL Observability goes beyond break/fix. 74 Observabilidad mejora
más que reparar. OPERATIONAL RESILIENCE MANAGED TECH DEBT QUALITY CODE PREDICTABLE RELEASE USER INSIGHT
@lizthegrey en #DevOpsDaysGDL Observability isn't just the data. 75 Observabilidad
es más que los datos. INSTRUMENT QUERY
@lizthegrey en #DevOpsDaysGDL SLOs and Observability go together. 76 SLOs
y Observabilidad funcionan juntos.
@lizthegrey en #DevOpsDaysGDL But they alone don't create collaboration. 77
También necesitamos colaboración.
@lizthegrey en #DevOpsDaysGDL Heroism isn't sustainable. 78 No podemos ser
héroes por siempre.
@lizthegrey en #DevOpsDaysGDL Debugging is not a solo activity. 79
No podemos depurar sólos.
@lizthegrey en #DevOpsDaysGDL Debugging is for everyone. 80 Todos los
puestos participan en depurar.
@lizthegrey en #DevOpsDaysGDL Collaboration is interpersonal. 81 Tenemos que comunicar
entre personas.
@lizthegrey en #DevOpsDaysGDL Lean on your team. 82 Nuestro equipo
puede ayudarnos.
@lizthegrey en #DevOpsDaysGDL We learn better when we document. 83
Aprendemos más cuando documentamos.
@lizthegrey en #DevOpsDaysGDL Fix hero culture. Share knowledge. 84 No
habrá héroes si compartimos.
@lizthegrey en #DevOpsDaysGDL Reward curiosity and teamwork. 85 Recompenses curiosidad
y cooperación.
@lizthegrey en #DevOpsDaysGDL 86 Improve the future by learning the
past. Mejoras la futura cuando aprendas el pasado.
@lizthegrey en #DevOpsDaysGDL Outages don't repeat, but they rhyme. 87
Los cortes tienen similaridades.
@lizthegrey en #DevOpsDaysGDL Risk analysis helps us plan. 88 Cuando
analizamos los riesgos, planificamos.
@lizthegrey en #DevOpsDaysGDL Quantify risks by frequency & impact. 89
Los riesgos tienen frecuencias y efectos.
@lizthegrey en #DevOpsDaysGDL Which risks are most significant? 90 Cuáles
riesgos son los más peligrosos?
@lizthegrey en #DevOpsDaysGDL Address risks that threaten the SLO. 91
Arregles riesgos que amenazan el SLO.
@lizthegrey en #DevOpsDaysGDL Make the business case to fix them.
92 Tenemos razones para arreglarlos.
@lizthegrey en #DevOpsDaysGDL And prioritize completing the work. 93 Y
podemos priorizar la finalización.
@lizthegrey en #DevOpsDaysGDL Don't waste time chrome polishing. 94 No
debemos perder horas sin hacer nada.
@lizthegrey en #DevOpsDaysGDL Lack of observability is systemic risk. 95
La falta de observabilidad es un riesgo.
@lizthegrey en #DevOpsDaysGDL So is lack of collaboration. 96 Y
la falta de colaboración también.
@lizthegrey en #DevOpsDaysGDL 97 Success doesn't demand heroism. No necesitamos
héroes para tener éxito.
@lizthegrey en #DevOpsDaysGDL Season the alphabet soup with ProdEx 98
La sopa sabe más deliciosa con ProdEx
@lizthegrey en #DevOpsDaysGDL ProdEx is easier with the right tools!
99 ProdEx es fácil con herramientas útiles!
@lizthegrey en #DevOpsDaysGDL Excelencia de producción mejora los equipos. Medir.
Depurar. Colaborar. Reparar. 100 lizthegrey.com; @lizthegrey PS tengo pegatinas! /liz
@lizthegrey en #DevOpsDaysGDL Production Excellence brings teams closer together. Measure.
Debug. Collaborate. Fix. 101 lizthegrey.com; @lizthegrey p.s. I have stickers! /liz