Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Análise de Dados com Python no dia a dia: subst...

Análise de Dados com Python no dia a dia: substituindo planilhas por código

O uso de planilhas é muito comum em tarefas que envolvem transformação e análise de dados. No entanto, essa abordagem pode facilmente se tornar demorada, tediosa e propensa a erros. Nesta palestra veremos como é possível usar Python para automatizar tarefas do cotidiano empresarial e acadêmico com um mínimo de esforço.

Avatar for Rodrigo Amaral

Rodrigo Amaral

August 23, 2019
Tweet

More Decks by Rodrigo Amaral

Other Decks in Programming

Transcript

  1. Análise de dados com Python no dia a dia Substituindo

    planilhas por código Rodrigo Amaral DCOMP/UFS 23 de agosto de 2019 São Cristóvão - Sergipe
  2. Quem sou eu Rodrigo Amaral • Analista de Tecnologia da

    Informação no TRT da 20ª Região (SE) • Mestre em Ciência da Computação pela UFS • Coorganizador do Python User Group Sergipe (PUG-SE) • Fã de música, livros e basquete amaral101 amaral101 rodrigoamaral rodrigoamaral [email protected]
  3. Um dia comum no escritório... ‍ - Temos que explorar

    esses dados para tentar extrair [insira algum tipo de informação]... - Vamos usar Excel? ‍ - Parece uma boa ideia! - Precisamos de uma nova funcionalidade. Vou criar uma cópia da planilha e implementá-la. ‍ - Ei! Quem foi que implementou essa funcionalidade x? Como isso funciona? Temos que criar uma planilha para controlar essas alterações!
  4. Qual a versão está valendo? MOFFIT, Chris. Escaping the Excel

    Hell with Python and Pandas <https://github.com/chris1610/pbpython/blob/master/presentations/Escaping-Excel-Hell-with-Python-and-Pandas.pdf> Qual a versão que está valendo? 2
  5. Copiar e colar não é uma opção Situações que imploram

    por automatização de planilhas: • O tempo disponível é curto • O processo é tedioso e sujeito a erros • Os conjuntos de dados excedem a capacidade da planilha • A tarefa envolve muita manipulação de texto
  6. Por que Python? • Legível e expressiva • Fácil de

    aprender • Múltiplos propósitos • Integração com outras linguagens e ferramentas • Ampla utilização em análise de dados
  7. Boas práticas • Use um sistema de controle de versões

    (e.g. git) para o código produzido • Mantenha código e dados separados • Escreva – e mantenha atualizada – documentação para os trechos de código mais complexos
  8. Mas calma… também há alguns desafios • Jupyter ◦ Células

    executadas fora de ordem • Aprender uma nova tecnologia ◦ Como convencer as pessoas de mais essa tarefa • Formatação ◦ Ficamos sem os recursos de formatação de texto • Distribuição ◦ Como compartilhar a solução com outras pessoas de maneira fácil?
  9. O PUG-SE é uma iniciativa comunitária que tem o objetivo

    de reunir os desenvolvedores e demais interessados na linguagem de programação Python e em suas tecnologias associadas. http://se.python.org.br https://t.me/pugse @pugse
  10. Referências 1. MOFFITT, Chris. “Escaping the Excell Hell with Python

    and Pandas” <https://github.com/chris1610/pbpython/blob/master/presentations/Escaping-Excel-Hell-with-Pyth on-and-Pandas.pdf> 2. JetBrains. “The State of Developer Ecosystem 2019”. <https://www.jetbrains.com/lp/devecosystem-2019/> 3. pandas: powerful Python data analysis toolkit <https://pandas.pydata.org/pandas-docs/stable/> 4. GRUS, Joel. “I Don’t Like Notebooks”. Slides <https://docs.google.com/presentation/d/1n2RlMdmv1p25Xy5thJUhkKGvjtV-dkAIsUXP-AL4ffI/edit ?usp=sharing>, Vídeo <https://www.youtube.com/watch?v=7jiPeIFXb6U>