Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Physicists in Data Science (talk in Hungarian l...
Search
szilard
October 09, 2018
0
81
Physicists in Data Science (talk in Hungarian language) - AtomCsill (from the atoms to the stars) lecture series for high-school students - Eotvos University, Budapest, Oct 2018
szilard
October 09, 2018
Tweet
Share
More Decks by szilard
See All by szilard
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Data Con LA - Oct 2020
szilard
0
210
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - Albuquerque Machine Learning Meetup (Online) - Aug 2020
szilard
0
160
Better than Deep Learning: Gradient Boosting Machines (GBM) - eRum conference - invited talk - June 2020
szilard
0
140
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - LA Data Science Meetup - February 2020
szilard
0
130
A Random Walk in Data Science and Machine Learning in Practice - CEU, Business Analytics Masters - Budapest, Febr 2020
szilard
0
320
Better than My Meetup/Conference Talks: Going Deeper in Various GBM Topics - GBM Advanced Workshop - Budapest, Nov 2019
szilard
0
97
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Budapest BI Forum, Budapest, Nov 2019
szilard
0
150
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - LA Data Science Meetup - Playa Vista, August 2019
szilard
0
140
Better than Deep Learning: Gradient Boosting Machines (GBM) / 2019 edition - Budapest R and Data Science Meetups - Budapest, June 2019
szilard
0
120
Featured
See All Featured
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.3k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
49k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
0
110
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
90
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
180
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
Building Adaptive Systems
keathley
44
2.9k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
96
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
110
Transcript
Fizikusok az adattudományban Pafka Szilárd Epoch (USA) AtomCsill, ELTE TTK
Budapest, 2018. október
Adattudomány / adatbányászat data science / data mining
Adattudomány / adatbányászat data science / data mining adatok érték
Adattudomány / adatbányászat data science / data mining adatok érték
adatok: számítógépes rendszerekben érték: tudás, vmi hasznos, vállalatnál $$$
None
None
None
None
None
None
None
y = f (x1, x2, ... , xn)
y = f (x1, x2, ... , xn)
Adattudomány?
Adattudomány?
Adattudomány?
Adattudomány?
None
None
None
None
None
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
None
None
None
None
None
None
None
Adatbányászat?
None
- valószínűségi eloszlások - valószínűségi összefüggések - valószínűségszámítás - statisztika
...
None
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
None
None
None
None
None
None
None
None
None
None
None
https://www.stitchdata.com/resources/reports/the-state-of-data-science/ (2015)
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD 2006- Kalifornia, data science 2016-17 CEU, UCLA (1-1 kurzus)
numerikus jártasság adatok manipulációja, “tisztítása” adatvizualizáció eszközök erre (Unix/Linux, Matlab,
R, Python) programozás szimulációk modellekben való gondolkodás
None
Soft skills: - curiosity - creativity - skepticism - ask
good questions - communication
By 2018, the US alone could face a shortage of
140,000 to 190,000 people with deep analytical skills - McKinsey, 2011
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
Összefoglaló: 1. Adattudomány: példák, 1 projekt röviden (eszközök, szükséges tudás)
2. Miért fizikusok? 3. Pár karriertanács