Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
コミュニティサービスにおける機械学習のためのアノテーション
Search
tatsushim
July 05, 2018
Research
2.2k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
コミュニティサービスにおける機械学習のためのアノテーション
Annotation Meetup ~ 機械学習における教師データ作成をテーマに、アノテーションのノウハウを共有する勉強会 ~ の登壇資料
tatsushim
July 05, 2018
More Decks by tatsushim
See All by tatsushim
DockerとAmazon SageMakerで実現した機械学習システムのプロダクション移行
tatsushim
0
27k
日本のママをコンテナで支える
tatsushim
1
3.2k
コネヒトが考える技術選択の仕方について
tatsushim
0
22k
コネヒトが考えるサービスづくりに必要な技術とその考え方について
tatsushim
2
3.3k
word2vecで女性向けQ&Aサイトを解析してみた
tatsushim
0
6.4k
独身男性のためのデータドリブン講座
tatsushim
0
6.9k
Other Decks in Research
See All in Research
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
260
National high-resolution cropland classification of Japan with agricultural census information and multi-temporal multi-modality datasets
satai
3
290
Model Discovery and Graph Simulation: A Lightweight Gateway to Chaos Engineering
anatolykr
0
200
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
830
はじまりの クエスチョンブック —余暇と豊かさにあふれた社会とは?
culturaltransition
PRO
0
520
事後確率分布の共分散について
koide3
0
140
PGDM: Physically Guided Diffusion Model for L Downscaling
satai
2
280
Using our influence and power for patient safety
helenbevan
0
360
【Zozo Research 技術共有会】三次元領域の現在と展望
mickey_0226
3
380
RS-Agent: Automating Remote Sensing Tasks through Intelligent Agent
satai
2
300
「行ける・行けない表」による地域公共交通の性能評価
bansousha
0
160
Apache Gravitinoで実現する Icebergカタログ統合とアクセスの一元化
matsumooon
0
290
Featured
See All Featured
Accessibility Awareness
sabderemane
1
140
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
330
Product Roadmaps are Hard
iamctodd
PRO
55
12k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.6k
Designing for Timeless Needs
cassininazir
1
260
Prompt Engineering for Job Search
mfonobong
0
350
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
My Coaching Mixtape
mlcsv
0
150
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
Transcript
$POOFIJUP*OD$50!UBUTVTIJN ϚϚͷҰาΛࢧ͑Δ ίϛϡχςΟαʔϏεʹ͓͚Δ ػցֶशͷͨΊͷΞϊςʔγϣϯ
ࣗݾհ
w ίωώτגࣜձࣾ ݱࡏظ w େֶӃ࣌ म࢜ ʹىۀ w
ڞಉۀऀऔక$50 w ઐػցֶश w ,%%*άϧʔϓʹ."͞ΕάϧʔϓೖΓ ౡాୡ࿕ !UBUTVTIJN
None
ਓͷੜ׆ʹͳͯ͘ͳΒͳ͍ͷΛͭ͘Δ
Ϣʔβʔͷߘʹྔߴ͑͘ΔϢʔβʔ͕ଟ͍ ఆྔ
Ϣʔβʔͷߘʹྔߴ͑͘ΔϢʔβʔ͕ଟ͍ ఆੑ ίϝϯτ͕ ͙͢ฦͬͯ͘Δ Ͱ ճ͕དྷΔ ಉ͡Έ ΛڞײͰ͖Δ
Ϣʔβʔͷߘʹྔߴ͑͘ΔϢʔβʔ͕ଟ͍ ఆੑ ίϝϯτ͕ ͙͢ฦͬͯ͘Δ Ͱ ճ͕དྷΔ ಉ͡Έ ΛڞײͰ͖Δ ࣮ϚϚϦͷ͜ͷΑ͏ͳ
ʮ͔͍͋ͨͨίϛϡχςΟʯ Λػցֶश͕ࢧ͍͑ͯ·͢
ػցֶशͷ׆༻ࣄྫʹ͍ͭͯจΛॻ͖·ͨ͠ IUUQTXXXXBOUFEMZDPNDPNQBOJFTDPOOFIJUPQPTU@BSUJDMFT
$POOFIJUP*OD$50!UBUTVTIJN ϚϚͷҰาΛࢧ͑Δ ίϛϡχςΟαʔϏεʹ͓͚Δ ػցֶशͷͨΊͷΞϊςʔγϣϯ
$POOFIJUP*OD$50!UBUTVTIJN ϚϚͷҰาΛࢧ͑Δ ίϛϡχςΟαʔϏεʹ͓͚Δ ػցֶशͷͨΊͷΞϊςʔγϣϯ
ϚϚϦͷΑ͏ͳίϛϡχςΟͷதͰ2"Λߦ͏αʔϏεͷ֓ཁਤ
ػցֶशͷಋೖχʔζͷ࣮ྫ
• ίϛϡχςΟʹ͓͍࣭ͯʹରͯ͠ճ͕༩͑ ΒΕ͍ͯΔ͜ͱ͕ͱͯେࣄ • ະճΛԿʹԼ͛Δ͜ͱ͕Ͱ͖Δ͔, ͕ϙΠϯ τ • ߘޙ,
ະճʹͳͬͨ··ͷ࣭ΛRˍDͷதͰ ੳͯ͠Έͨ త
lർΕͯΠϥΠϥΛਓʹͿ͚ͭͯ͠·͍·͢खΛ͋͛ͨ Γ͠ͳ͍͚Ͳɼ͍ͭΠϥΠϥౖͯ͠໐ͬͯ͠·͏ ͜Μͳࣗʹݏؾ͕͞͠·͢ਖ਼ਏ͍z
lർΕͯΠϥΠϥΛਓʹͿ͚ͭͯ͠·͍·͢खΛ͋͛ͨ Γ͠ͳ͍͚Ͳɼ͍ͭΠϥΠϥౖͯ͠໐ͬͯ͠·͏ ͜Μͳࣗʹݏؾ͕͞͠·͢ਖ਼ਏ͍z ੳΛͯ͠ΈΔͱ ͜ͷΑ͏ͳߘ ճΛ༩͑ΒΕʹ͍͘͜ͱ͕Θ͔ͬͨ
lർΕͯΠϥΠϥΛਓʹͿ͚ͭͯ͠·͍·͢खΛ͋͛ͨ Γ͠ͳ͍͚Ͳɼ͍ͭΠϥΠϥౖͯ͠໐ͬͯ͠·͏ ͜Μͳࣗʹݏؾ͕͞͠·͢ਖ਼ਏ͍z ײͷڞײΛٻΊΔ͜ͷΑ͏ͳߘ ΛʮڞײΛٻΊΔ࣭ʯͱఆٛ͢Δ
՝ͷղܾํ๏
՝ͷղܾํ๏
՝ͷղܾํ๏ ࣭ͷߴ͍ڭࢣσʔλ͕ඞཁ
ίϛϡχςΟαʔϏε ʹ͓͚ΔΞϊςʔγϣϯͷ՝
Ξϊςʔγϣϯͷ֎͕͍͠
• ίϛϡχςΟͰʑΓͱΓ͞ΕΔಠಛͷݴ͍ճ͠ දݱ, ίϯςΩετͷཧղ͕ඞཁ • Ex. 8w5d = ৷ܦաظ͕ؒ8िؒͱ5
• ͭ·Γ, Amazon Mechanical TurkͳͲͷΫϥυιʔ γϯάαʔϏεͷར༻͕Ͱ͖ͳ͍ • ίϛϡχςΟΛৗۀͰݟ͍ͯΔ ίϛϡχςΟϚωʔδϟʔͰͳ͍ͱਖ਼͍͠அ ͍͠ Ξϊςʔγϣϯͷ֎͕͍͠
• ຖίϛϡχςΟΛݟͯ, ͦͷίϛϡχςΟͰ ʹڍ͕ͬͨ͜ͱงғؾΛ؍͠, αʔϏε ͷվળɾاըFB͢Δׂ • ϢʔβʔΠϯλϏϡʔͷ૭ޱΧελϚʔαϙʔ τରԠ݉
• ϚϚϦͷʮ͔͍͋ͨͨίϛϡχςΟʯΛҡ࣋͠ վળ͍ͯͨ͘͠Ίʹ͔ܽͤͳ͍ଘࡏ ίϛϡχςΟϚωʔδϟʔͷׂ
΄Μͱ୴ಹ͕Ոࣄ͠ͳͯ͘ϜΧͭ͘ྉཧຖͯ͠Δͷ ʹΰϛࣺͯҰͭ͠ͳ͍ͬͯͲʔΏ͏͜ͱͳΜ օ͞Μͦ ͏ࢥ͍·ͤΜ
΄Μͱ୴ಹ͕Ոࣄ͠ͳͯ͘ϜΧͭ͘ྉཧຖͯ͠Δͷ ʹΰϛࣺͯҰͭ͠ͳ͍ͬͯͲʔΏ͏͜ͱͳΜ օ͞Μͦ ͏ࢥ͍·ͤΜ ͜ΕڞײΛٻΊΔ࣭ʁ ͦΕͱڞײҎ֎ΛٻΊΔ࣭ʁ
΄Μͱ୴ಹ͕Ոࣄ͠ͳͯ͘ϜΧͭ͘ྉཧຖͯ͠Δͷ ʹΰϛࣺͯҰͭ͠ͳ͍ͬͯͲʔΏ͏͜ͱͳΜ օ͞Μͦ ͏ࢥ͍·ͤΜ ݟΛ࣋ͬͯదͳஅΛͯ͘͠ΕΔͷ͕ ίϛϡχςΟϚωʔδϟʔ
ֶशثͷਫ਼্ͷͨΊʹ ίϛϡχςΟϚωʔδϟʔ ͱͷ࿈ܞ͕ෆՄܽ
ҰํͰ ਓͷஅʹΑΔ՝
• ϥϕϧ͚ݶΒΕͨਓͷίϛϡχςΟϚωʔ δϟʔʹΑͬͯߦΘΕΔ • ਓͳͷͰͲ͏ͯͦ͠ͷਓͷओ؍͕ೖΔ • ΞϊςʔγϣϯσʔλͷҰ؏ੑͷ୲อ͕͍͠ அ͕ओ؍త
Ͳ͏ͬͯΞϊςʔγϣϯ͢Δʁ
• ෳਓͷఆ݁ՌΛ༻͍Δ • ଟஈ(ϚϚϦͰ4ஈ֊)ͷϥϕϧ • kappaΛ༻͍ͯྨͷҰகݟΔ Ұ؏ੑΛ୲อ͢ΔͨΊͷऔΓΈ
• ෳਓͷఆ݁ՌΛ༻͍Δ • ଟஈ(ϚϚϦͰ4ஈ֊)ͷϥϕϧ • kappaΛ༻͍ͯྨͷҰகݟΔ Ұ؏ੑΛ୲อ͢ΔͨΊͷऔΓΈ
• Definitely Yes(DY)ఆऀ͕ࣗ৴Λ࣋ͬͯஅ͠ ͨࡍʹ༻͍ΒΕΔ • Probably Yes(PY) DY ΑΓࣗ৴͕ͳ͍͕YesͰ
͋Ζ͏ͱஅͨ͠ࡍʹ༻͍ΒΕΔ ஈ֊ͷϥϕϧ
• දதͷ Y ڞײΛٻΊΔ࣭ͱͯ͠ྨ͠ɼN ڞײҎ֎ΛٻΊΔ࣭ͱྨ • ఆ݁Ռ͕Ұக͠ͳ͍, Dͱͳ͍ͬͯΔ෦ʹؔͯ͠
ϥϕϧෆՄೳͱஅ͠ɼσʔληοτ͔Βআ͘ ஈ֊ͷϥϕϧ
• ෳਓͷఆ݁ՌΛ༻͍Δ • ଟஈ(ϚϚϦͰ4ஈ֊)ͷϥϕϧ • kappaΛ༻͍ͯྨͷҰகݟΔ Ұ؏ੑΛ୲อ͢ΔͨΊͷऔΓΈ
LBQQB
ͬͨ͜ͱ͋ΔΑͱ͍͏ํ
kappaͷఆٛ SFG+3-BOEJTBOE((,PDI5IF.FBTVSFNFOUPG0CTFSWFS"HSFFNFOUGPS$BUFHPSJDBM%BUB #JPNFUSJDT 7PM /P QQ
kappaͷఆٛ SFG+3-BOEJTBOE((,PDI5IF.FBTVSFNFOUPG0CTFSWFS"HSFFNFOUGPS$BUFHPSJDBM%BUB #JPNFUSJDT 7PM /P QQ
kappaͷఆٛ SFG+3-BOEJTBOE((,PDI5IF.FBTVSFNFOUPG0CTFSWFS"HSFFNFOUGPS$BUFHPSJDBM%BUB #JPNFUSJDT 7PM /P QQ
• ೋਓͷఆऀʹΑΔྨͷҰகΛݟΔ • 1ʹ͍ۙ΄ͲҰக͕ߴ͍ • 0.8ΑΓେ͖͚ΕҰக΄ͱΜͲҰக͍ͯ͠Δ ͱݟͳͤΔ kappaͷҙຯ SFG-BOEJT+3
,PDI((5IFNFBTVSFNFOUPGPCTFSWFSBHSFFNFOUGPSDBUFHPSJDBMEBUB#JPNFUSJDT ɹ
࣭ͷߴ͍Ξϊςʔγϣϯσʔλ ͷ࡞ʹऔΓΜͰ͍·͢
͜Ε·Ͱ ͱ͜Ε͔Β
શࠃʹ57$.Λ์ө
• CMͷ݁Ռ, τϥϑΟοΫ2ഒʹ • ϚϚ͚No.1ͱͳΓߦͱͷऔΓΈࣾ ձͷൃ৴ߦ͍ͬͯΔ • ࣾձͷΠϯϑϥʹ͖ۙͮͭͭ͋ΔதͰ αʔϏεͷίΞςΫϊϩδʔͰ͋Δ
ػցֶशͷΠϯύΫτେ͖͘ͳΔ ػցֶशͷΠϯύΫτ͕େ͖͘ͳΔ
• ઌఔͷྫͷΑ͏ͳྨλεΫݚڀͱͯ͠ લྫ͕গͳ͘, ͞ΒʹػցֶशʹΑΔࣄۀ ΠϯύΫτΛΕΔ͜ͱͱͯΓ͕͍ ͕͋Δ • ඇ࿈ଓͳΛΔνϟϯε͕͋Δ •
ٕज़ͷྗͰ, ࠓΑΓ͏Ұஈ֊্ͷίϛϡ χςΟΛ͍͖ͬͯ·͢ ඇ࿈ଓͳΛػցֶशͰΔ
·ͱΊ
• ϚϚ͚No.1ΞϓϦͷϚϚϦ͕࣋ͭ ʮ͔͋ͨͨΈͷ͋ΔίϛϡχςΟʯ ػցֶशʹΑ࣮ͬͯݱ͞Ε͍ͯΔ • ఆ͕͍͠Ξϊςʔγϣϯʹ͍ͭͯίϛϡ χςΟϚωʔδϟʔͱ࿈ܞΛ͠ͳ͕Β, ਖ਼͍͠ Ξϊςʔγϣϯ͕Ͱ͖͍ͯΔ͔Λ౷ܭతʹ֬ೝ
͍ͯ͠Δ • ͜Ε͔Βඇ࿈ଓͳΛٕज़Ͱ͍ͬͯ͘ ·ͱΊ
͏ͪΐͬͱΛฉ͍ͯΈ͍ͨͱ ࢥͬͨํؾܰʹ͓͕͚͍ͩ͘͞ ͘͠!UBUTVTIJNʹ%.Ͱ
$POOFIJUP*OD$50!UBUTVTIJN ϚϚͷҰาΛࢧ͑Δ ͝ਗ਼ௌ༗͏͍͟͝·ͨ͠%