Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Physicists in Data Science (talk in Hungarian l...
Search
szilard
October 09, 2018
92
0
Share
Physicists in Data Science (talk in Hungarian language) - AtomCsill (from the atoms to the stars) lecture series for high-school students - Eotvos University, Budapest, Oct 2018
szilard
October 09, 2018
More Decks by szilard
See All by szilard
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Data Con LA - Oct 2020
szilard
0
230
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - Albuquerque Machine Learning Meetup (Online) - Aug 2020
szilard
0
170
Better than Deep Learning: Gradient Boosting Machines (GBM) - eRum conference - invited talk - June 2020
szilard
0
150
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - LA Data Science Meetup - February 2020
szilard
0
140
A Random Walk in Data Science and Machine Learning in Practice - CEU, Business Analytics Masters - Budapest, Febr 2020
szilard
0
330
Better than My Meetup/Conference Talks: Going Deeper in Various GBM Topics - GBM Advanced Workshop - Budapest, Nov 2019
szilard
0
110
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Budapest BI Forum, Budapest, Nov 2019
szilard
0
170
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - LA Data Science Meetup - Playa Vista, August 2019
szilard
0
150
Better than Deep Learning: Gradient Boosting Machines (GBM) / 2019 edition - Budapest R and Data Science Meetups - Budapest, June 2019
szilard
0
130
Featured
See All Featured
A Soul's Torment
seathinner
6
2.8k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
270
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
200
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
240
The agentic SEO stack - context over prompts
schlessera
0
790
We Have a Design System, Now What?
morganepeng
55
8.1k
Designing Experiences People Love
moore
143
24k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
590
Code Reviewing Like a Champion
maltzj
528
40k
It's Worth the Effort
3n
188
29k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.3k
Transcript
Fizikusok az adattudományban Pafka Szilárd Epoch (USA) AtomCsill, ELTE TTK
Budapest, 2018. október
Adattudomány / adatbányászat data science / data mining
Adattudomány / adatbányászat data science / data mining adatok érték
Adattudomány / adatbányászat data science / data mining adatok érték
adatok: számítógépes rendszerekben érték: tudás, vmi hasznos, vállalatnál $$$
None
None
None
None
None
None
None
y = f (x1, x2, ... , xn)
y = f (x1, x2, ... , xn)
Adattudomány?
Adattudomány?
Adattudomány?
Adattudomány?
None
None
None
None
None
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
None
None
None
None
None
None
None
Adatbányászat?
None
- valószínűségi eloszlások - valószínűségi összefüggések - valószínűségszámítás - statisztika
...
None
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
None
None
None
None
None
None
None
None
None
None
None
https://www.stitchdata.com/resources/reports/the-state-of-data-science/ (2015)
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD 2006- Kalifornia, data science 2016-17 CEU, UCLA (1-1 kurzus)
numerikus jártasság adatok manipulációja, “tisztítása” adatvizualizáció eszközök erre (Unix/Linux, Matlab,
R, Python) programozás szimulációk modellekben való gondolkodás
None
Soft skills: - curiosity - creativity - skepticism - ask
good questions - communication
By 2018, the US alone could face a shortage of
140,000 to 190,000 people with deep analytical skills - McKinsey, 2011
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
Összefoglaló: 1. Adattudomány: példák, 1 projekt röviden (eszközök, szükséges tudás)
2. Miért fizikusok? 3. Pár karriertanács