Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Monitorando seu banco na nuvem

Monitorando seu banco na nuvem

Nesse Tutorial eu pretendo descrever um guia de como monitorar seus servidores PostgreSQL através dos exporters proprios, gerir alertas de monitoramento e também como criar dashboards pra monitorar os servidores usandro prometheus e grafana. Minha idéia é fazer um handson de toda a solução e apresentar alguns cases aonde é possivel monitorar o banco, as apps, e também passar a monitorar algumas regras de negocio.

Apresentei essa talk no PGConf.Brasil 2019

Sebastian Webber

August 01, 2019
Tweet

More Decks by Sebastian Webber

Other Decks in Programming

Transcript

  1. Como monitoramos isso ? Aplicação Banco de Dados CPU MemÓria

    Disco REDE CPU MemÓria Disco REDE CPU MemÓria Disco REDE CPU MemÓria Disco REDE CPU MemÓria Disco REDE CPU MemÓria Disco REDE
  2. Nasce um uma nova forma de fazer as coisas -

    Micro-serviços - Nano-Serviços - Distribuídos - Pequenos - Independentes - Tecnologia heterogênea CONTAINERS
  3. Como é uma arquitetura atualmente ? APP 1 APP 3

    APP 6 APP 2 APP 2 APP 6 APP 2 APP 1 APP 7 APP 5 APP 2 APP 1 APP 5 APP 4 APP 4 APP 4 APP 3 APP 1 APP 1 APP 1 APP 2 APP 2 APP 5 APP 6 APP 4 APP 4 APP 1 APP 4 APP 1 APP 2
  4. E como monitoramos isso? APP 1 APP 3 APP 6

    APP 2 APP 2 APP 6 APP 2 APP 1 APP 7 APP 5 APP 2 APP 1 APP 5 APP 4 APP 4 APP 4 APP 3 APP 1 APP 1 APP 1 APP 2 APP 2 APP 5 APP 6 APP 4 APP 4 APP 1 APP 4 APP 1 APP 2 CPU MemÓria Disco REDE
  5. E como monitoramos isso? APP 1 APP 3 APP 6

    APP 2 APP 2 APP 6 APP 2 APP 1 APP 7 APP 5 APP 2 APP 1 APP 5 APP 4 APP 4 APP 4 APP 3 APP 1 APP 1 APP 1 APP 2 APP 2 APP 5 APP 6 APP 4 APP 4 APP 1 APP 4 APP 1 APP 2 CPU MemÓria Disco REDE
  6. E como monitoramos isso? APP 1 CPU - 100% APP

    1 CPU - 100% APP 1 CPU - 10% APP 1 CPU - 12% APP 1 CPU - 100% APP 1 CPU - 2% AVG CPU - 54%
  7. E como monitoramos isso? APP 1 CPU - 95% APP

    1 CPU - 90% APP 1 CPU - 10% APP 1 CPU - 12% APP 1 CPU - 90% APP 1 CPU - 2% AVG CPU - 49%
  8. Vamos analisar - 50% dos usuários está presenciando lentidão neste

    momento APP 1 CPU - 100% APP 1 CPU - 100% APP 1 CPU - 10% APP 1 CPU - 12% APP 1 CPU - 100% APP 1 CPU - 2%
  9. Vamos mudar a pergunta Para seu usuário: Qual o valor

    ideal para uso de CPU ? Qual o valor ideal para uso de Memória ? Qual o valor ideal para uso de Disco ? Qual o valor ideal para uso de Rede ?
  10. O sistema tem que estar disponível O sistema tem que

    ser rápido O sistema não pode ter erros O que seu usuário quer...
  11. SINTOMAS vs CAUSAS • Dor de garganta • Febre •

    Dor no corpo • Faringite • Laringite • E Ite, e ite, e ite
  12. SLI Real system problems 1. Quantos ms leva pra adicionar

    um item no carrinho? 2. Quandos ms leva para aprovar a compra? 3. Média de erros ao aprovar uma compra
  13. SLO vs SLA O que queremos entregar (METAS) vs o

    que mínimo que temos de entregar (CONTRATO)
  14. my apps • Latency • Errors • Traffic • Saturation

    Primary database • Latency • Errors • Traffic • Saturation Read replica • Latency • Errors • Traffic • Saturation