Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Vivendo a catástrofe total: Observabilidade de ...

Vivendo a catástrofe total: Observabilidade de micro serviços

Palestra apresentada pelo Patrick Porto na 51º Python Floripa on-line https://www.youtube.com/watch?v=AL5EMLjcmbU&t=49s

Python Floripa

September 26, 2020
Tweet

More Decks by Python Floripa

Other Decks in Programming

Transcript

  1. Sintoma vs causa Sintoma Causa A API está retornando HTTP

    500 Os servidores de banco de dados estão recusando conexões Os dados não foram processados com sucesso CPUs estão sobrecarregadas por um bogosort Os usuários de São Paulo não estão recebendo GIFs animados de gatos Sua CDN odeia pizza sem ketchup e felinos e, portanto, bloqueou alguns IPs de cliente
  2. Tracing TracingId=8d4b6778-6ae8-46fe-a406-5cb95b740a8b,Message=Trying connect to server TracingId=9f520a2a-003a-4d61-8e80-a6173ac2440a,Message=Trying connect to server TracingId=8d4b6778-6ae8-46fe-a406-5cb95b740a8b,Message=Protocol

    problem: connection reset TracingId=9f520a2a-003a-4d61-8e80-a6173ac2440a,Message=Successful connection TracingId=8d4b6778-6ae8-46fe-a406-5cb95b740a8b,Message=Retrying connect to server
  3. Estratégia de Logging • Granularidade muito alta • Difícil de

    monitorar • Caro com o custo crescendo linearmente
  4. Exemplos de Métricas • Taxa de erro • Tempo de

    resposta • Quantidade de requisições