Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Web scraping, python, e ordem da câmara dos ver...
Search
Gabriela
November 02, 2020
1
51
Web scraping, python, e ordem da câmara dos vereadores
Gabriela
November 02, 2020
Tweet
Share
More Decks by Gabriela
See All by Gabriela
Python: O poder da linguagem, diversidade e mercado de trabalho
gabicavalcante
0
100
Desbravando Comunidades
gabicavalcante
0
31
Featured
See All Featured
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Mobile First: as difficult as doing things right
swwweet
225
10k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
120
20k
Typedesign – Prime Four
hannesfritz
42
2.9k
Designing Experiences People Love
moore
143
24k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Site-Speed That Sticks
csswizardry
13
990
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
380
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
Context Engineering - Making Every Token Count
addyosmani
9
480
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
54k
Transcript
Web scraping, python, e ordem da câmara dos vereadores 01
Gabi Cavalcante 02 ❯ natalense ❯ 25 anos ❯ TI
❯ @stone-payments ❯ @twilio ❯ autenticação e autorização. e-commerce. chatbots. ❯ ciência de dados/ETL; QE; teste; arquitetura. ❯ PyLadies Natal
❯❯ Web scraping ❯ Python ❯ Ordem da câmara 03
04 a construção de um agente para baixar, analisar e
organizar dados da Web de maneira automatizada fonte: Practical Web Scraping for Data Science (Broucke and Baesens).
05
❯ Web scraping ❯❯ Python ❯ Ordem da câmara 06
❯ Web scraping ❯ Python ❯❯ Ordem da câmara 07
08
Título de CIDADÃO NATALENSE 09
RESULTADOS Total de pautas: Títulos: 1773 21 - 1.18% 10
11
RESULTADOS Total de pautas: Títulos: 1773 1080 - 60.91% 12
O QUE USEI PRA RASPAR 13 ❯ bs4 ❯ scrapy
❯ requests-html
14
15
16
O QUE USEI PRA EXTRAIR 17 ❯ PyPDF2 + regex
❯ pdfPlumber ❯ rows ++
DICAS [1] Python Assíncrono: tudo ao mesmo tempo agora -
Luciano Ramalho [2] rows [2] blog do scrapy 18 CONTRIBUA [1] Brasil.io [2] Querido diário [3] Dados Abertos de Feira
DÚVIDAS? me encontrem: Twitter: @_gabicavalcante Telegram: @gabrilas GitHub: gabicavalcante 19