Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
坂本勇人選手はいつ通算3,000安打を達成するか? AIに聞いてみました / Hayato S...
Search
Shinichi Nakagawa
PRO
December 13, 2020
Research
1
830
坂本勇人選手はいつ通算3,000安打を達成するか? AIに聞いてみました / Hayato Sakamoto Performance Prediction Using Feature Engineering with Machine Learning and Python
Sports Analytics Meetup #9 2020/12/13 LT
#Baseball #SABRmetrics #ML #Python
Shinichi Nakagawa
PRO
December 13, 2020
Tweet
Share
More Decks by Shinichi Nakagawa
See All by Shinichi Nakagawa
実践Dash - 手を抜きながら本気で作るデータApplicationの基本と応用 / Dash for Python and Baseball
shinyorke
PRO
2
1.4k
Terraform, GitHub Actions, Cloud Buildでデータ基盤をProvisioningする / Data Platform provisioning for Google Cloud and Terraform
shinyorke
PRO
2
2.9k
Cloud RunとCloud PubSubでサーバレスなデータ基盤2024 with Terraform / Cloud Run and PubSub with Terraform
shinyorke
PRO
9
2.9k
自らを強いエンジニアにするための3つの習慣 / I need to be myself, I can't be no one else
shinyorke
PRO
77
72k
阪神タイガース優勝のひみつ - Pythonでシュッと調べた件 / SABRmetrics for Python
shinyorke
PRO
1
1.3k
Pythonとクラウドと野球の推し活. / Baseball Data Platform for Python and Google Cloud
shinyorke
PRO
2
2.7k
月額コーヒー3.34杯分のコストでオオタニサンの活躍を見守るデータ基盤のはなし / Pyhack Con
shinyorke
PRO
2
470
俺のDXを実現するためのサーバレスなデータ基盤開発と運用 / Serverless Data Platform and Baseball
shinyorke
PRO
5
11k
機械学習エンジニアが目指すキャリアパスとその実話 / My Journey to Become a ML Engineer
shinyorke
PRO
9
16k
Other Decks in Research
See All in Research
[2024.08.30] Gemma-Ko, 오픈 언어모델에 한국어 입히기 @ 머신러닝부트캠프2024
beomi
0
810
Embers of Autoregression: Understanding Large Language Models Through the Problem They are Trained to Solve
eumesy
PRO
7
1.2k
「並列化時代の乱数生成」
abap34
3
910
尺度開発における質的研究アプローチ(自主企画シンポジウム7:認知行動療法における尺度開発のこれから)
litalicolab
0
360
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
270
最近のVisual Odometryと Depth Estimation
sgk
1
310
The Relevance of UX for Conversion and Monetisation
itasohaakhib1
0
120
言語と数理の交差点:テキストの埋め込みと構造のモデル化 (IBIS 2024 チュートリアル)
yukiar
4
920
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
8
1k
機械学習による言語パフォーマンスの評価
langstat
6
810
Neural Fieldの紹介
nnchiba
1
410
論文読み会 KDD2024 | Relevance meets Diversity: A User-Centric Framework for Knowledge Exploration through Recommendations
cocomoff
0
110
Featured
See All Featured
Embracing the Ebb and Flow
colly
84
4.5k
YesSQL, Process and Tooling at Scale
rocio
169
14k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
The Cost Of JavaScript in 2023
addyosmani
45
7k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.9k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
28
2.1k
Put a Button on it: Removing Barriers to Going Fast.
kastner
59
3.6k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.2k
Speed Design
sergeychernyshev
25
670
Producing Creativity
orderedlist
PRO
341
39k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
229
52k
Transcript
ӫޫͷഎ൪߸6⃣ ࡔຊ༐ਓ3,000ຊ҆ଧه೦LT Shinichi Nakagawa(@shinyorke) Sports Analyst Meetup #9 2020/12/13
ʁʁʁʮ༐ਓ·ͩ2,000ຊ҆ଧΖʯ
ͦͷͱ͓ΓͰ͍͟͝·͢, ࣦྱ͠·ͨ͠
ࡔຊ༐ਓ͍ͭ௨ࢉ3,000ຊ҆ଧΛ ୡ͢Δ͔AIʹฉ͍ͯΈ·ͨ͠ Shinichi Nakagawa(@shinyorke) Sports Analyst Meetup #9 2020/12/13
ຊͷςʔϚ • ࡔຊ༐ਓ͕͍ͭ͝Ζ௨ࢉ3,000ຊ҆ଧΛୡ͢Δ͔༧͢Δ • ਅ໘ͳ, ༧ଌͲ͜·ͰͰ͖Δ͔ࢼͯ͠ΈΔ • ʮӫޫͷഎ൪߸6⃣ࡔຊ༐ਓ3,000ຊ҆ଧͷಓʯ͕ Կޙʹ์ө͞ΕΔ͔Θ͔Δ΄͏͕͍͍ΑͶʢదʣ
Who am I ?ʢ͓લ୭Αʣ • Shinichi Nakagawaʢத ৳Ұʣ • େͷSNSͰʮshinyorkeʢ͠ΜΑʔ͘ʣʯͱ໊͍ͬͯ·͢
• JX Press Corporation Senior Engineer ʢJX௨৴ࣾ γχΞɾΤϯδχΞʣ • Baseball Engineer, Data Scientist ʢੜͷٿΤϯδχΞɾσʔλαΠΤϯςΟετʣ • Ҏલ͓ࣄͰٿΤϯδχΞʮͩͬͨʯਓ
ʲCMʳαʔόʔαΠυΠϯλʔϯืूͯ͠·͢ https://www.wantedly.com/projects/543767 ※ֶੜ͞ΜݶఆͰ͢&ผʹεϙʔπͷࣄͬͯ༁͡Όͳ͍Ͱ͢
26.4ඵͰৼΓฦΔ2020ͷϓϩٿ • ιϑτόϯΫϗʔΫεຊҰʢ4࿈ʣ • όϯςϦϯυʔϜφΰϠ&౦ژυʔϜͷձࣾ(ry • ࡔຊ༐ਓʢڊਓʣ, ӈଧऀͱͯ͠࠷গͰ2,000ຊ҆ଧୡ ͦͷଞʹ͍ͬͺ͍͋Δ͚ͲׂѪʢదʣ
ࡔຊ༐ਓબखͳΒ3,000ຊ҆ଧ༨༟Ͱ • 31ࡀ10ϲ݄Ͱͷୡӈଧऀ࠷ • গͳ͘ͱ͋ͱ4, 5ݱ͢ΔͰ͠ΐ γϣʔτͰݩؾʹΠέͯ·͢͠. • ͡Ό͍͋ͭࠒ3,000ຊ҆ଧΔͷ͞?
͜Εͬͯաڈͷσʔλ͔Β͏·͍۩߹ʹΕ༧ଌՄೳͰ? https://www.nikkansports.com/baseball/news/202011080000831.html
ͱ͍͏Θ͚Ͱ༧ଌϞσϧΛ࡞Γ·ͨ͠. ࠓճPyCon JP 2020ͰͬͨͭΛݩʹͪΐͬͱΞϨϯδͯ͠࡞Γ·ͨ͠. https://shinyorke.hatenablog.com/entry/baseball-and-ml-with-python
ࠓճͷΞϓϩʔνʢΊͬͪΌཁʣ • ϝδϟʔϦʔάͷσʔλΛͬͯ 1.࠷ۙ୳ࡧܥͷΞϧΰϦζϜͰ͍ۙબख୳͠ 2.֬ʢͬΆ͍ʣํ๏Ͱ༧ଌΛ࡞Δ • ↑ͷ݁ՌΛStreamlitͰՄࢹԽ
ͳͥϝδϟʔͷσʔλͳͷ͔ • 3,000ຊ҆ଧୡऀ, ຊϓϩٿҰਓ͔͍͠ͳ͍ʢ͠ʣ ※ʮ୭Ͱ͔͢ʁʯ࣭ͬͯ׃ͧ • ϝδϟʔେਖ਼ٛΠνϩʔ༷ଞ, 3,000ຊ҆ଧୡऀ͕ଟ͍. •
σʔλͷϥΠηϯε&εΫϨΠϐϯάͱ͔େมͰ͠ΐ.
ࡔຊ༐ਓʹ͍ۙϝδϟʔϦʔΨʔ ࢲʢshinyorkeʣ࡞, ʮzobristʯϞσϧͰग़ͨ݁͠Ռʢ΄΅ANNͰ͢ʣ ϝδϟʔϦʔάΛͬͯΔਓ͔ΒΈΔͱೲಘͷ݁ՌͩͱࢥΘΕ ໊͓લνʔϜ ʢ௨ࢉʣ ଧຊྥଧ௨ࢉ҆ଧ ಛͱ͔ 9BOEFS#PHBFSUT
ʢ3FE4PYʣ ଧ੮ӈଧ ௨ࢉ014 ݱ۶ࢦͷ߈ܸܕγϣʔτ %FSFL+FUFS ʢ:BOLFFTʣ ଧ੮ӈଧ આ໌ෆཁͷελʔ खʹݶΔͱ௨ࢉ҆ଧҐ 5SPZ5VMPXJU[LJ ʢ3PDLJFT FUDʜʣ ଧ੮ӈଧ ௨ࢉ014 ߈ܸܕγϣʔτ ͳ͓ຊڌ +JNNZ3PMMJOT ʢ1IJMMJFT FUDʜʣ ଧ੮྆ଧ कඋܕͳγϣʔτ ࣮ಇͷແࣄ೭໊അ
σϞ͠·͢
ࡔຊ༐ਓͷࠓޙ - ҆ଧɾຊྥଧɾଧ ࣅ͍ͯΔϝδϟʔϦʔΨʔXਓͷΛ75%λΠϧͰࢉग़
ࡔຊ༐ਓͷࠓޙ - ଧ ࣅ͍ͯΔϝδϟʔϦʔΨʔXਓͷΛ75%λΠϧͰࢉग़
ࡔຊ༐ਓͷࠓޙΛ·ͱΊΔͱ 2027ʢ38ࡀʣ·Ͱنఆଧ֬อͰ͖ΔͬΆ͍. ※نఆଧ443ଧ੮ʢ2019ͷࢼ߹143×3.1Ͱܭࢉ, ࢛ࣺޒೖʣ ྸ ଧ ҆ଧ ຊྥଧ
ଧ ଧ
ࡔຊ༐ਓબख, ௨ࢉʢ༧ଌʣ ͜ΕͰγϣʔτͩͬͨΒڧ͗͢Ͱʢ͑ʣ ظؒ ଧ ҆ଧ ຊྥଧ ଧ ଧ ·Ͱ
˞ݱ࣮ ˞༧ଌ ௨ࢉʢ༧ଌʣ
ߟ • 39ࡀ͝Ζʹ3,000ຊ҆ଧୡ…ͷϖʔε·͋·͋͋Γͦ͏. ͨͩ͠ྼԽආ͚ΒΕͳ͍. • 36ࡀ͔ΒͷٸܹྼԽकඋҐஔมߋͱ͔ͰઌԆ͠Ͱ͖ͦ͏. ʲࢀߟʳѨ෦৻೭ॿ36ࡀ͔Βัख->ϑΝʔετʹίϯόʔτ •
௨ࢉຊྥଧʢ༧ଌʣ321ຊ…334ຊߦͬͯཉ͍͚͠ͲͲ͏͔
͜ͷ͓͠·͍Ͱ͢…͕ʂʁ • ༧ଌϞσϧ࡞ΓηΠόʔϝτϦΫεແ͠ͰͰ͖ͳ͔ͬͨ • ʮRʹΑΔηΠόʔϝτϦΫεೖʯग़ͨ͠, ͜ͷลΛಛྔΤϯδχΞϦϯάతʹৼΓฦΓ͍ͨ • ͍ͬͯ͏ϩϯάτʔΫ͕Ͱ͖ͨΒ͍͍ͳ⚾
ʢҙ༁ɿࠓճંͬͨϞσϧͷΛ͍ͨ͠ʣ ӡӦͷօ༷, ͝ݕ౼ΑΖ͓͘͠ئ͍͠·͢
ήʔϜηοτ⚾ ͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠. Shinichi Nakagawa(Twitter/Facebook/etc… @shinyorke)