Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
はじめての機械学習 / entrance-to-machine-learning2022
Search
松村優哉
April 16, 2022
Programming
1.2k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
はじめての機械学習 / entrance-to-machine-learning2022
松村優哉
April 16, 2022
More Decks by 松村優哉
See All by 松村優哉
validateパッケージでデータを検証する / Data Validation with validate package
y__mattu
0
690
rstanの環境構築 / Set Up rstan
y__mattu
1
1.2k
R言語とGo言語 / R and Go
y__mattu
2
1.1k
はじめての機械学習 / Entrance to Machine Learning
y__mattu
0
820
平均値と中央値の違いについて
y__mattu
1
960
dplyr 1.0.0の新機能 / dplyr 1.0.0
y__mattu
2
10k
Other Decks in Programming
See All in Programming
技術記事、AIに書かせるか、自分で書くか? 〜それでも私が自分の手で書く理由〜 / #QiitaConference
jnchito
2
1.4k
代数的データ型って何が嬉しいの? #frontend_phpcon_do
kajitack
8
3.7k
Go1.27で導入されるジェネリクスメソッドでできること
mackee
0
140
AIだと陥りがちなJakarta EE最新技術への移行時の落とし穴と解決策
tnagao7
0
110
JavaDoc 再入門
nagise
1
370
メソッドのジェネリクスでGoの夢は広がるか? / Kyoto.go #65
utgwkk
3
840
Java × distroless で 軽量なコンテナイメージを / Java on Distroless
contour_gara
0
550
TSKaigi Night Talks 2026_TypeScriptでサプライチェーンの整合性を型に閉じ込める
geekplus_tech
0
400
依存関係から依存物へ―Dependencyという言葉の歴史をひも解く
j_lee
0
120
Mujeres en SEO Summit 2026 - Greatest Disaster Hits en Web Performance
guaca
0
190
Strategic Design in the Frontend: Moduliths & Micro Frontends @DDDEurope
manfredsteyer
PRO
0
110
フロントエンドとバックエンドで「1文字」を揃えよう
youkidearitai
PRO
0
710
Featured
See All Featured
Designing for Timeless Needs
cassininazir
1
260
Ethics towards AI in product and experience design
skipperchong
2
310
The Curse of the Amulet
leimatthew05
1
13k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1.1k
Six Lessons from altMBA
skipperchong
29
4.3k
How STYLIGHT went responsive
nonsquared
100
6.2k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
Exploring anti-patterns in Rails
aemeredith
3
410
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
230
Transcript
͡Ίͯͷػցֶश !Z@@NBUUV 5PLZP3
୭ʁ • 名前: 松村優哉 • 学⽣時代の専⾨: 計量経済学、 ベイズ統計、因果推論、マーケティング (研究室のAWSの管理とかもやってた) •
⾔語: R(8年⽬くらい), Python • TVCM中⼼の広告系企業で データサイエンティストしてます • Tokyo.R 運営(初⼼者セッション等) • 近況: 引っ越しました(練⾺区⺠→世⽥⾕区⺠) @y__mattu ymattu 2
એ • Ӊ ધ ຊ͜ͱʰ<վఆ൛>3ϢʔβͷͨΊͷ34UVEJP<࣮ફ>ೖʱ 3 ୈষ 3TUVEJPͷجૅ ୈষ εΫϨΠϐϯάʹΑΔσʔλऩू
ୈষ EQMZSUJEZSʹΑΔσʔλલॲཧ ୈষ HHQMPUʹΑΔσʔλՄࢹԽ ୈষ 3.BSLEPXOʹΑΔσʔλՄࢹԽ ධൃചதʂʂ
࣍ • ػցֶशͱ • ڭࢣ͋Γֶश WTڭࢣͳֶ͠श • ྨ WTճؼ •
Ϟσϧબ • 3Ͱػցֶश 4
͜ͷࢿྉͷରɾత ର • ʮػցֶशʯͱ͍͏ݴ༿Λฉ͍ͨ͜ͱ͕͋Δ͕Α͘Θ͔Βͳ͍ • ͜Ε͔ΒσʔλੳΛษڧ͢Δ త • ʮػցֶशͬͯ݁ہԿΛͬͯΔͷʁʯΛͬ͘͟Γཧղ͢Δ •
ʮػցֶश ͍͠ʯPSʮػցֶशͬͯ"*ͰΊͬͪΌ͍͢͝ʯͱ͍͏Π ϝʔδͷ১ • ͜Ε͔Βษڧ͢Δͱ͖ͷ͓࣋ͬͯ͘ͱ͍͍ΠϝʔδΛʹ͚ͭΔ • Α͘ग़ͯ͘ΔΩʔϫʔυͷཧղ ͞ͳ͍͜ͱ • ࣜʹΑΔղઆ 5
ػցֶशͱ 6 • ⼀⾔で σʔλ͔ΒύλʔϯΛೝࣝ͠ɺ ະͷ͑Λ༧ଌ͢ΔͨΊͷϧʔϧΛ ࣗಈతʹ࡞Γग़͢Α͏ʹɺ ϚγϯʢίϯϐϡʔλʣΛτϨʔχϯά͢Δ
؆୯ͳΠϝʔδ 7 • 残業時間と退職のデータがあったとします • 残業時間で退職の有無をおよそ判断できるように、線を引く =パターン認識 ۀ࣌ؒ 退職した 退職しない
ۀ࣌ؒ
؆୯ͳΠϝʔδ 8 • 新しいデータが得られたとき、引いた線によって、退職の有無を予 測できる ۀ࣌ؒ
アルゴリズム データ モデル 線の引き⽅ 線が引かれている状態
ڭࢣ͋Γֶश WTڭࢣͳֶ͠श
ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 10 • ڭࢣ͋Γֶश • աڈͷσʔλͷதʹϥϕϧ͕͋Δ • ϞσϧͷதɺϥϕϧΛ༧ଌ͢ΔͨΊͷϧʔϧ ୀ৬ 1
0 0 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ తม ैଐม આ໌ม ಠཱม ༧ଌม ಛྔ
ڭࢣ͋ΓֶशͷදతͳΞϧΰϦζϜ 11 • ઢܗճؼ • ϩδεςΟοΫճؼɺ(-. • 47. • ܾఆɺϥϯμϜϑΥϨετ
• 9(#PPTUɺ-JHIU(#.
12 ୀ৬ 1 0 0 1 ۀ ࣌ؒ ྸ څ༩
ɾɾɾ アルゴリズム モデル ୀ৬ ︖ ︖ ︖ ︖ ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ୀ৬ 0 0 1 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ༧ଌ
ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 13 • ڭࢣͳֶ͠श • աڈͷσʔλͷதʹϥϕϧ͕ͳ͍ • Ϟσϧͷதɺάϧʔϓ͚ͷϧʔϧ • ϥϕϧɺ͚ΒΕͨ݁ՌΛݟͯਓ͕͚ͭΔ
ۀ ࣌ؒ ྸ څ༩ ɾɾɾ આ໌ม ಠཱม ༧ଌม ಛྔ ۀɾଟ څ༩ɾଟ ۀɾগ څ༩ɾଟ
ڭࢣͳֶ͠शͷදతͳΞϧΰϦζϜ 14 • ΫϥελϦϯά • ,NFBOT • ओੳ • ҟৗݕ
• τϐοΫϞσϧ
͔͜͜Βɺڭࢣ͋Γֶशʹ যΛͯͯ
ྨ WTճؼ
ྨͱճؼ 17 • ྨ • తม͕ΧςΰϦʔ • ճؼ • తม͕
ࣙΊΔʁࣙΊͳ͍ʁ ݘʁೣʁϥΠΦϯʁ དྷظͷडʁ དྷళʁ גՁʁ ೋྨ ଟྨɾଟΫϥεྨ
Ϟσϧબ Ϟσϧͷͯ·Γͱ൚Խੑ
Ϟσϧબ 19 • Ұ൪ྑ͍ઢͷҾ͖ํʁ • ֶशσʔλʹର͢Δਫ਼ • ະͷσʔλʹର͢Δ༧ଌྗ څྉ ۀ࣌ؒ
ສ ສ
Ϟσϧબ 20 • ڀۃతʹɺ͜͏ • ֶशσʔλʹର͢Δ༧ଌྗ • ະͷσʔλʹର͢Δ༧ଌྗऑͦ͏ څྉ ۀ࣌ؒ
ສ ສ ະͷσʔλ͕͜͜ͷͱ͖ɺ ϞσϧͲͪΒͱ༧ଌ͢Δʁ
Ϟσϧબ 21 • ͜ͷ͘Β͍͕όϥϯεྑͦ͞͏ • ֶशσʔλʹର͢Δ༧ଌྗ • ະͷσʔλʹର͢Δ༧ଌྗڧͦ͏ څྉ ۀ࣌ؒ
ສ ສ
Ϟσϧબ 22 • ະͷσʔλͷ༧ଌྗڧͦ͏ɺऑͦ͏ΛͲ͏அ͢Δ͔ʁ ˠσʔλΛֶश༻ɺςετ༻ʹׂͯ͠ɺςετ༻Ͱ༧ଌྗΛଌΔ • ࢀߟΫϩεόϦσʔγϣϯ ୀ৬ 1 0
0 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ֶश༻ ςετ༻ ϥϯμϜʹ͘Β͍͕ଟ͍ IUUQTRJJUBDPN
[email protected]
JUFNTEFFEDCBC
ྨΛ3ͰͬͯΈΔ
ѻ͏σʔλ 24 • ペンギンデータ JOTUBMMQBDLBHFT QBMNFSQFOHVJOT MJCSBSZ QBMNFSQFOHVJOT EBUB
QBDLBHFQBMNFSQFOHVJOT` IFBE QFOHVJOT "UJCCMFY TQFDJFTJTMBOECJMM@MFOHUI@NN CJMM@EFQUI@NN GMJQQFS@MFOHUI@ʜCPEZ@NBTT@H TFY GDUGDUECMECMJOUJOUGDU "EFMJF5PSHFʜNBMF "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜ/"/"/"/"/" "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜNBMF ʜXJUINPSFWBSJBCMFZFBSJOU EBU QFOHVJOT EQMZSGJMUFS JTOB TFY TFY͕ܽଛͷྻΛআ֎
ܾఆϞσϧ 25 σʔλΛׂ JEY TBNQMF OSPX EBU OSPX EBU
EBUBUSBJO EBU<JEY > EBUBUFTU EBU<JEY > NPEFMEU QBSUZLJUDUSFF TQFDJFTd EBUBEBUBUSBJO QMPU NPEFMEU UZQFTJNQMF
ϥϯμϜϑΥϨετ 26 IUUQTXXXOJLLFJSDPKQHMPTTBSZJE
ϥϯμϜϑΥϨετ 27 NPEFMSG SBOHFSSBOHFS TQFDJFTd EBUBEBUBUSBJO NUSZ OVNUSFFT
SFTVMUSG QSFEJDU NPEFMEU EBUBUFTU DNSG DBSFUDPOGVTJPO.BUSJY SFTVMUSG EBUBUFTUTQFDJFT $POGVTJPO.BUSJYBOE4UBUJTUJDT 3FGFSFODF 1SFEJDUJPO"EFMJF$IJOTUSBQ(FOUPP "EFMJF $IJOTUSBQ (FOUPP 0WFSBMM4UBUJTUJDT "DDVSBDZ $* /P*OGPSNBUJPO3BUF 17BMVF<"DD/*3>F ɾɾɾ
·ͱΊ
·ͱΊ 29 • 機械学習は、要するにパターン認識 • データをマッピングして、線を引くイメージ • ⽅法として、教師あり学習と教師なし学習がある • 教師あり→データにラベルがある
• 教師なし→データにラベルがない • ラベルが数値の場合、回帰。ラベルがカテゴリの場合、分類。 • モデルの当てはまり・汎化性に気をつけよう • Rでは様々なアルゴリズムに対応するパッケージが⽤意されている • 使ってみて、統⼀感がないなあと思う場合はtidymodelsもおすすめ