Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Physicists in Data Science (talk in Hungarian l...
Search
szilard
October 09, 2018
92
0
Share
Physicists in Data Science (talk in Hungarian language) - AtomCsill (from the atoms to the stars) lecture series for high-school students - Eotvos University, Budapest, Oct 2018
szilard
October 09, 2018
More Decks by szilard
See All by szilard
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Data Con LA - Oct 2020
szilard
0
230
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - Albuquerque Machine Learning Meetup (Online) - Aug 2020
szilard
0
170
Better than Deep Learning: Gradient Boosting Machines (GBM) - eRum conference - invited talk - June 2020
szilard
0
150
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - LA Data Science Meetup - February 2020
szilard
0
140
A Random Walk in Data Science and Machine Learning in Practice - CEU, Business Analytics Masters - Budapest, Febr 2020
szilard
0
330
Better than My Meetup/Conference Talks: Going Deeper in Various GBM Topics - GBM Advanced Workshop - Budapest, Nov 2019
szilard
0
110
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Budapest BI Forum, Budapest, Nov 2019
szilard
0
170
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - LA Data Science Meetup - Playa Vista, August 2019
szilard
0
150
Better than Deep Learning: Gradient Boosting Machines (GBM) / 2019 edition - Budapest R and Data Science Meetups - Budapest, June 2019
szilard
0
130
Featured
See All Featured
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
270
Optimising Largest Contentful Paint
csswizardry
37
3.7k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
360
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
210
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.3k
Transcript
Fizikusok az adattudományban Pafka Szilárd Epoch (USA) AtomCsill, ELTE TTK
Budapest, 2018. október
Adattudomány / adatbányászat data science / data mining
Adattudomány / adatbányászat data science / data mining adatok érték
Adattudomány / adatbányászat data science / data mining adatok érték
adatok: számítógépes rendszerekben érték: tudás, vmi hasznos, vállalatnál $$$
None
None
None
None
None
None
None
y = f (x1, x2, ... , xn)
y = f (x1, x2, ... , xn)
Adattudomány?
Adattudomány?
Adattudomány?
Adattudomány?
None
None
None
None
None
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
None
None
None
None
None
None
None
Adatbányászat?
None
- valószínűségi eloszlások - valószínűségi összefüggések - valószínűségszámítás - statisztika
...
None
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
None
None
None
None
None
None
None
None
None
None
None
https://www.stitchdata.com/resources/reports/the-state-of-data-science/ (2015)
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD 2006- Kalifornia, data science 2016-17 CEU, UCLA (1-1 kurzus)
numerikus jártasság adatok manipulációja, “tisztítása” adatvizualizáció eszközök erre (Unix/Linux, Matlab,
R, Python) programozás szimulációk modellekben való gondolkodás
None
Soft skills: - curiosity - creativity - skepticism - ask
good questions - communication
By 2018, the US alone could face a shortage of
140,000 to 190,000 people with deep analytical skills - McKinsey, 2011
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
Összefoglaló: 1. Adattudomány: példák, 1 projekt röviden (eszközök, szükséges tudás)
2. Miért fizikusok? 3. Pár karriertanács