Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
はじめての機械学習 / entrance-to-machine-learning2022
Search
松村優哉
April 16, 2022
Programming
1.2k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
はじめての機械学習 / entrance-to-machine-learning2022
松村優哉
April 16, 2022
More Decks by 松村優哉
See All by 松村優哉
validateパッケージでデータを検証する / Data Validation with validate package
y__mattu
0
690
rstanの環境構築 / Set Up rstan
y__mattu
1
1.2k
R言語とGo言語 / R and Go
y__mattu
2
1.1k
はじめての機械学習 / Entrance to Machine Learning
y__mattu
0
820
平均値と中央値の違いについて
y__mattu
1
960
dplyr 1.0.0の新機能 / dplyr 1.0.0
y__mattu
2
10k
Other Decks in Programming
See All in Programming
正しくソフトウェアを作る、前提を疑うための認知の視点 / doubt-premise
minodriven
21
6.7k
コンテキストの使い捨てをやめる — ビジネスルール駆動開発と miko —
ioki
0
210
TAKTでAI駆動開発の品質を設計する
j5ik2o
7
1.4k
C# and C++ Interoperability - cho-dotnetnew
harukasao
0
260
Go1.27で導入されるジェネリクスメソッドでできること
mackee
0
140
Composerを使ったサプライチェーン攻撃の様子を眺めてみる #phpstudy
o0h
PRO
2
250
不変条件と整合性境界—ビジネスが決める設計判断と実現パターン / Invariants and Consistency Boundaries
nrslib
14
5.6k
The ROI of Quarkus for Spring Boot Applications
hollycummins
0
120
Creating Composable Callables in Contemporary C++
rollbear
0
150
さぁV100、メモリをお食べ・・・
nilpe
0
150
Snowflake Summitでの新機能 CoCo / CoWork / snowflake-summit-2026-overall-what-new-coco
tatsuhiro
1
150
A2UI という光を覗いてみる
satohjohn
1
140
Featured
See All Featured
4 Signs Your Business is Dying
shpigford
187
22k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
56k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.5k
The Cult of Friendly URLs
andyhume
79
6.9k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
430
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
240
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
How to build a perfect <img>
jonoalderson
1
5.7k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.4k
Transcript
͡Ίͯͷػցֶश !Z@@NBUUV 5PLZP3
୭ʁ • 名前: 松村優哉 • 学⽣時代の専⾨: 計量経済学、 ベイズ統計、因果推論、マーケティング (研究室のAWSの管理とかもやってた) •
⾔語: R(8年⽬くらい), Python • TVCM中⼼の広告系企業で データサイエンティストしてます • Tokyo.R 運営(初⼼者セッション等) • 近況: 引っ越しました(練⾺区⺠→世⽥⾕区⺠) @y__mattu ymattu 2
એ • Ӊ ધ ຊ͜ͱʰ<վఆ൛>3ϢʔβͷͨΊͷ34UVEJP<࣮ફ>ೖʱ 3 ୈষ 3TUVEJPͷجૅ ୈষ εΫϨΠϐϯάʹΑΔσʔλऩू
ୈষ EQMZSUJEZSʹΑΔσʔλલॲཧ ୈষ HHQMPUʹΑΔσʔλՄࢹԽ ୈষ 3.BSLEPXOʹΑΔσʔλՄࢹԽ ධൃചதʂʂ
࣍ • ػցֶशͱ • ڭࢣ͋Γֶश WTڭࢣͳֶ͠श • ྨ WTճؼ •
Ϟσϧબ • 3Ͱػցֶश 4
͜ͷࢿྉͷରɾత ର • ʮػցֶशʯͱ͍͏ݴ༿Λฉ͍ͨ͜ͱ͕͋Δ͕Α͘Θ͔Βͳ͍ • ͜Ε͔ΒσʔλੳΛษڧ͢Δ త • ʮػցֶशͬͯ݁ہԿΛͬͯΔͷʁʯΛͬ͘͟Γཧղ͢Δ •
ʮػցֶश ͍͠ʯPSʮػցֶशͬͯ"*ͰΊͬͪΌ͍͢͝ʯͱ͍͏Π ϝʔδͷ১ • ͜Ε͔Βษڧ͢Δͱ͖ͷ͓࣋ͬͯ͘ͱ͍͍ΠϝʔδΛʹ͚ͭΔ • Α͘ग़ͯ͘ΔΩʔϫʔυͷཧղ ͞ͳ͍͜ͱ • ࣜʹΑΔղઆ 5
ػցֶशͱ 6 • ⼀⾔で σʔλ͔ΒύλʔϯΛೝࣝ͠ɺ ະͷ͑Λ༧ଌ͢ΔͨΊͷϧʔϧΛ ࣗಈతʹ࡞Γग़͢Α͏ʹɺ ϚγϯʢίϯϐϡʔλʣΛτϨʔχϯά͢Δ
؆୯ͳΠϝʔδ 7 • 残業時間と退職のデータがあったとします • 残業時間で退職の有無をおよそ判断できるように、線を引く =パターン認識 ۀ࣌ؒ 退職した 退職しない
ۀ࣌ؒ
؆୯ͳΠϝʔδ 8 • 新しいデータが得られたとき、引いた線によって、退職の有無を予 測できる ۀ࣌ؒ
アルゴリズム データ モデル 線の引き⽅ 線が引かれている状態
ڭࢣ͋Γֶश WTڭࢣͳֶ͠श
ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 10 • ڭࢣ͋Γֶश • աڈͷσʔλͷதʹϥϕϧ͕͋Δ • ϞσϧͷதɺϥϕϧΛ༧ଌ͢ΔͨΊͷϧʔϧ ୀ৬ 1
0 0 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ తม ैଐม આ໌ม ಠཱม ༧ଌม ಛྔ
ڭࢣ͋ΓֶशͷදతͳΞϧΰϦζϜ 11 • ઢܗճؼ • ϩδεςΟοΫճؼɺ(-. • 47. • ܾఆɺϥϯμϜϑΥϨετ
• 9(#PPTUɺ-JHIU(#.
12 ୀ৬ 1 0 0 1 ۀ ࣌ؒ ྸ څ༩
ɾɾɾ アルゴリズム モデル ୀ৬ ︖ ︖ ︖ ︖ ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ୀ৬ 0 0 1 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ༧ଌ
ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 13 • ڭࢣͳֶ͠श • աڈͷσʔλͷதʹϥϕϧ͕ͳ͍ • Ϟσϧͷதɺάϧʔϓ͚ͷϧʔϧ • ϥϕϧɺ͚ΒΕͨ݁ՌΛݟͯਓ͕͚ͭΔ
ۀ ࣌ؒ ྸ څ༩ ɾɾɾ આ໌ม ಠཱม ༧ଌม ಛྔ ۀɾଟ څ༩ɾଟ ۀɾগ څ༩ɾଟ
ڭࢣͳֶ͠शͷදతͳΞϧΰϦζϜ 14 • ΫϥελϦϯά • ,NFBOT • ओੳ • ҟৗݕ
• τϐοΫϞσϧ
͔͜͜Βɺڭࢣ͋Γֶशʹ যΛͯͯ
ྨ WTճؼ
ྨͱճؼ 17 • ྨ • తม͕ΧςΰϦʔ • ճؼ • తม͕
ࣙΊΔʁࣙΊͳ͍ʁ ݘʁೣʁϥΠΦϯʁ དྷظͷडʁ དྷళʁ גՁʁ ೋྨ ଟྨɾଟΫϥεྨ
Ϟσϧબ Ϟσϧͷͯ·Γͱ൚Խੑ
Ϟσϧબ 19 • Ұ൪ྑ͍ઢͷҾ͖ํʁ • ֶशσʔλʹର͢Δਫ਼ • ະͷσʔλʹର͢Δ༧ଌྗ څྉ ۀ࣌ؒ
ສ ສ
Ϟσϧબ 20 • ڀۃతʹɺ͜͏ • ֶशσʔλʹର͢Δ༧ଌྗ • ະͷσʔλʹର͢Δ༧ଌྗऑͦ͏ څྉ ۀ࣌ؒ
ສ ສ ະͷσʔλ͕͜͜ͷͱ͖ɺ ϞσϧͲͪΒͱ༧ଌ͢Δʁ
Ϟσϧબ 21 • ͜ͷ͘Β͍͕όϥϯεྑͦ͞͏ • ֶशσʔλʹର͢Δ༧ଌྗ • ະͷσʔλʹର͢Δ༧ଌྗڧͦ͏ څྉ ۀ࣌ؒ
ສ ສ
Ϟσϧબ 22 • ະͷσʔλͷ༧ଌྗڧͦ͏ɺऑͦ͏ΛͲ͏அ͢Δ͔ʁ ˠσʔλΛֶश༻ɺςετ༻ʹׂͯ͠ɺςετ༻Ͱ༧ଌྗΛଌΔ • ࢀߟΫϩεόϦσʔγϣϯ ୀ৬ 1 0
0 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ֶश༻ ςετ༻ ϥϯμϜʹ͘Β͍͕ଟ͍ IUUQTRJJUBDPN
[email protected]
JUFNTEFFEDCBC
ྨΛ3ͰͬͯΈΔ
ѻ͏σʔλ 24 • ペンギンデータ JOTUBMMQBDLBHFT QBMNFSQFOHVJOT MJCSBSZ QBMNFSQFOHVJOT EBUB
QBDLBHFQBMNFSQFOHVJOT` IFBE QFOHVJOT "UJCCMFY TQFDJFTJTMBOECJMM@MFOHUI@NN CJMM@EFQUI@NN GMJQQFS@MFOHUI@ʜCPEZ@NBTT@H TFY GDUGDUECMECMJOUJOUGDU "EFMJF5PSHFʜNBMF "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜ/"/"/"/"/" "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜNBMF ʜXJUINPSFWBSJBCMFZFBSJOU EBU QFOHVJOT EQMZSGJMUFS JTOB TFY TFY͕ܽଛͷྻΛআ֎
ܾఆϞσϧ 25 σʔλΛׂ JEY TBNQMF OSPX EBU OSPX EBU
EBUBUSBJO EBU<JEY > EBUBUFTU EBU<JEY > NPEFMEU QBSUZLJUDUSFF TQFDJFTd EBUBEBUBUSBJO QMPU NPEFMEU UZQFTJNQMF
ϥϯμϜϑΥϨετ 26 IUUQTXXXOJLLFJSDPKQHMPTTBSZJE
ϥϯμϜϑΥϨετ 27 NPEFMSG SBOHFSSBOHFS TQFDJFTd EBUBEBUBUSBJO NUSZ OVNUSFFT
SFTVMUSG QSFEJDU NPEFMEU EBUBUFTU DNSG DBSFUDPOGVTJPO.BUSJY SFTVMUSG EBUBUFTUTQFDJFT $POGVTJPO.BUSJYBOE4UBUJTUJDT 3FGFSFODF 1SFEJDUJPO"EFMJF$IJOTUSBQ(FOUPP "EFMJF $IJOTUSBQ (FOUPP 0WFSBMM4UBUJTUJDT "DDVSBDZ $* /P*OGPSNBUJPO3BUF 17BMVF<"DD/*3>F ɾɾɾ
·ͱΊ
·ͱΊ 29 • 機械学習は、要するにパターン認識 • データをマッピングして、線を引くイメージ • ⽅法として、教師あり学習と教師なし学習がある • 教師あり→データにラベルがある
• 教師なし→データにラベルがない • ラベルが数値の場合、回帰。ラベルがカテゴリの場合、分類。 • モデルの当てはまり・汎化性に気をつけよう • Rでは様々なアルゴリズムに対応するパッケージが⽤意されている • 使ってみて、統⼀感がないなあと思う場合はtidymodelsもおすすめ