ML Engineer & Product Lead - MLOps @ GitLab Essa apresentação é limitada pela minha experiência profissional, e o aqui apresentado é somente uma perspectiva a ser considerada.
iniciativa sai da empresa - Mudança de prioridades - Insuficiência de dados ou dados de má qualidade - Falta de conhecimento das peculiaridades de ML - Projetos fadados ao fracasso por expectativas inalcançáveis - Diferentes objetivos entre praticantes de ML, usuários e líderes
iniciativa sai da empresa - Mudança de prioridades - Insuficiência de dados ou dados de má qualidade - Falta de conhecimento das peculiaridades de ML - Projetos fadados ao fracasso por expectativas inalcançáveis - Diferentes objetivos entre praticantes de ML, usuários e líderes
iniciativa sai da empresa - Mudança de prioridades - Insuficiência de dados ou dados de má qualidade - Falta de conhecimento das peculiaridades de ML - Projetos fadados ao fracasso por expectativas inalcançáveis - Diferentes objetivos entre praticantes de ML, usuários e líderes COMUNICAÇÃO
guiem o desenvolvimento do projeto. Alinhar expectativas com todos envolvidos no projeto. Identificar projetos fadados a fracassar. Desenvolver o modelo pensando na experiência do usuário.
problema já foi resolvido Nesse mundo, que mudou na experiência no usuário? Quais os indicadores que podem ser usados para quantificar essas mudanças? Qual o indicador de sucesso? Quais são os indicadores de validação?
podem ser usados. • É necessário explicar a razão de cada predição? • Em que momento a predição é feita? Quais os dados estão disponíveis no momento da predição? • Qual o tempo de resposta necessário para uma predição? • A predição é feita no aparelho do usuário, ou no servidor, ou em um microcontrolador? ….
obra é escassa e cara Colocar um modelo em produção requer arquitetura especializada (Model Registry, Pipelines para transformação de dados e treinamento de modelos, monitoramento de predições, etc) Modelos de Machine Learning tem data de validade: com o tempo as predições vão ficando piores, aumentando o custo de manutenção. Altamente exploratório, difícil de definir deadlines Difícil colocar a primeira versão online rápido para iterar com o usuário
para descobrir o que o usuário realmente quer Coletar dados rapidamente para criar um modelo melhor Define melhor os indicadores de sucesso e validação Vira Baseline para a uma futura solução de ML Talvez no final das contas ML seja até desnecessário
ao longo de todos os cortes. Na realidade, só um corte vai ser escolhido https://www.researchgate.net/figure/Risk- distributions-and-area-under-the-ROC-cur ve-AUC-adapted-from-Janssens-Martens- 35_fig4_336879307
ponto de corte traz o máximo retorno Cada classificação certa ou errada tem um custo associado (em dinheiro, em experiência de usuário) Qual o corte com melhor custo benefício? Retorno(T) = Custo_TP * TP(T) + Custo_TN * TN(T) - Custo_FP * FP(T) - Custo_FN * FN(T)
de métricas de modelo, que o modelo deve obter para alcançar a definição de sucesso Indicador de Sucesso MVA choro desespero gritaria terapia Requisitos Time de ML Especialistas de Domínio
a experiência de usuário? Como a predição seria acessada? Usuário acessa a página principal, e vê uma série de itens ofertados. Existe limite na oferta de itens? Novos itens são ofertados constantemente Qual o custo do erro? Errar uma predição não traz um custo alto
usar? O que importa aqui é recomendar o produto certo. Normalmente, usaria-se MAP@K Número de itens vistos é fixo, então Precisão com 5 itens (P@5) faz mais sentido.
R$200.000 -> 200.000/(70) -> 3000 transações adicionais Atualmente 10.000 transações -> Aumento de 30% em acertos Exemplo: Melhorar Ofertas para o usuário
R$200.000 -> 200.000/(70) -> 3000 transações adicionais Atualmente 10.000 transações -> Aumento de 30% em acertos P@5 atual = 10.000 transações / (20.000 visitas x 5 itens) = .1 Exemplo: Melhorar Ofertas para o usuário
R$200.000 -> 200.000/(70) -> 3000 transações adicionais Aumento de 30% em acertos P@5 atual = 10.000 transações / (20.000 visitas x 5 itens) = .1 Exemplo: Melhorar Ofertas para o usuário P@5 de sucesso = .1 x 1.3 = 0.13
chegar em um valor aproximado Normalmente, várias suposições são feitas no cálculo do MVA. Essas suposições devem ser testadas e atualizadas ao longo do tempo Não se apegue ao valor definido pelo MVA, ele vai mudar com o tempo e conforme ideias vão se cristalizando MVA: Considerações
sobre Machine Learning (embora auxilie na definição de expectativas), é uma ferramenta para educar o time de Machine Learning sobre o problema eles vão resolver A maior vantagem de explorar o MVA não é o valor em si, mas os processo de criação. Ao definir o MVA, o time precisa trabalhar com o business para definir as métricas, as expectativas, as peculiaridades do sistema. MVA: Considerações
para que elas guiem o desenvolvimento do projeto. Alinhar expectativas com todos envolvidos no projeto. Identificar projetos fadados a fracassar. Desenvolver o modelo pensando na experiência do usuário.
2 [Livro gratuito] "Everyone wants to do the model work, not the data work": Data Cascades in High-Stakes AI [Artigo] 150 Successful Machine Learning Models: 6 Lessons Learned at Booking.com [Artigo] Seven-steps to set goals and pick metrics for customers [Medium] Google Rules of ML [Website]