Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Physicists in Data Science (talk in Hungarian l...
Search
szilard
October 09, 2018
0
69
Physicists in Data Science (talk in Hungarian language) - AtomCsill (from the atoms to the stars) lecture series for high-school students - Eotvos University, Budapest, Oct 2018
szilard
October 09, 2018
Tweet
Share
More Decks by szilard
See All by szilard
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Data Con LA - Oct 2020
szilard
0
140
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - Albuquerque Machine Learning Meetup (Online) - Aug 2020
szilard
0
94
Better than Deep Learning: Gradient Boosting Machines (GBM) - eRum conference - invited talk - June 2020
szilard
0
92
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - LA Data Science Meetup - February 2020
szilard
0
83
A Random Walk in Data Science and Machine Learning in Practice - CEU, Business Analytics Masters - Budapest, Febr 2020
szilard
0
290
Better than My Meetup/Conference Talks: Going Deeper in Various GBM Topics - GBM Advanced Workshop - Budapest, Nov 2019
szilard
0
54
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Budapest BI Forum, Budapest, Nov 2019
szilard
0
130
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - LA Data Science Meetup - Playa Vista, August 2019
szilard
0
100
Better than Deep Learning: Gradient Boosting Machines (GBM) / 2019 edition - Budapest R and Data Science Meetups - Budapest, June 2019
szilard
0
80
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
409
22k
BBQ
matthewcrist
85
9.3k
Building Applications with DynamoDB
mza
90
6.1k
Happy Clients
brianwarren
98
6.7k
Designing on Purpose - Digital PM Summit 2013
jponch
115
7k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
329
21k
Designing for Performance
lara
604
68k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
93
17k
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Navigating Team Friction
lara
183
14k
Docker and Python
trallard
40
3.1k
Thoughts on Productivity
jonyablonski
67
4.3k
Transcript
Fizikusok az adattudományban Pafka Szilárd Epoch (USA) AtomCsill, ELTE TTK
Budapest, 2018. október
Adattudomány / adatbányászat data science / data mining
Adattudomány / adatbányászat data science / data mining adatok érték
Adattudomány / adatbányászat data science / data mining adatok érték
adatok: számítógépes rendszerekben érték: tudás, vmi hasznos, vállalatnál $$$
None
None
None
None
None
None
None
y = f (x1, x2, ... , xn)
y = f (x1, x2, ... , xn)
Adattudomány?
Adattudomány?
Adattudomány?
Adattudomány?
None
None
None
None
None
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
None
None
None
None
None
None
None
Adatbányászat?
None
- valószínűségi eloszlások - valószínűségi összefüggések - valószínűségszámítás - statisztika
...
None
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
None
None
None
None
None
None
None
None
None
None
None
https://www.stitchdata.com/resources/reports/the-state-of-data-science/ (2015)
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD 2006- Kalifornia, data science 2016-17 CEU, UCLA (1-1 kurzus)
numerikus jártasság adatok manipulációja, “tisztítása” adatvizualizáció eszközök erre (Unix/Linux, Matlab,
R, Python) programozás szimulációk modellekben való gondolkodás
None
Soft skills: - curiosity - creativity - skepticism - ask
good questions - communication
By 2018, the US alone could face a shortage of
140,000 to 190,000 people with deep analytical skills - McKinsey, 2011
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
Összefoglaló: 1. Adattudomány: példák, 1 projekt röviden (eszközök, szükséges tudás)
2. Miért fizikusok? 3. Pár karriertanács