Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BigQueryとPythonではじめるプロ野球選手の成績予測(もしくは成績占い) / Baseball Player Performance Prediction using BigQuery and Python
Search
Shinichi Nakagawa
May 27, 2022
Research
0
3.8k
BigQueryとPythonではじめるプロ野球選手の成績予測(もしくは成績占い) / Baseball Player Performance Prediction using BigQuery and Python
Baseball Play Study mini 2022/5/27 登壇資料
Shinichi Nakagawa
May 27, 2022
Tweet
Share
More Decks by Shinichi Nakagawa
See All by Shinichi Nakagawa
Terraform, GitHub Actions, Cloud Buildでデータ基盤をProvisioningする / Data Platform provisioning for Google Cloud and Terraform
shinyorke
2
2.4k
Cloud RunとCloud PubSubでサーバレスなデータ基盤2024 with Terraform / Cloud Run and PubSub with Terraform
shinyorke
9
2.4k
自らを強いエンジニアにするための3つの習慣 / I need to be myself, I can't be no one else
shinyorke
77
55k
阪神タイガース優勝のひみつ - Pythonでシュッと調べた件 / SABRmetrics for Python
shinyorke
1
1.2k
Pythonとクラウドと野球の推し活. / Baseball Data Platform for Python and Google Cloud
shinyorke
2
2.5k
月額コーヒー3.34杯分のコストでオオタニサンの活躍を見守るデータ基盤のはなし / Pyhack Con
shinyorke
2
410
俺のDXを実現するためのサーバレスなデータ基盤開発と運用 / Serverless Data Platform and Baseball
shinyorke
5
11k
機械学習エンジニアが目指すキャリアパスとその実話 / My Journey to Become a ML Engineer
shinyorke
6
14k
一人でも小さく始められるGoogle Cloudで実現するほぼサーバレスなデータ基盤 / Serverless Dataplatform for Google Cloud
shinyorke
0
480
Other Decks in Research
See All in Research
大規模言語モデル (LLM) の技術と最新動向
ikuyamada
30
15k
ランサーズエージェント_フリーランスエンジニアの年収・キャリアの実態調査2024
lancers_pr
0
310
Minimum Bayes-Risk Decoding における性能変動の理解に向けて(2024年6月5日 第59回 NLPコロキウム)
atsumoto
0
210
SSII2024 [TS3] 画像認識におけるマルチモーダル基盤モデル ~基盤モデル、あなたのタスクに役立つかも?~
ssii
PRO
0
810
スモールデータ勉強会発表資料
natsutan
0
310
独立成分分析を用いた埋め込み表現の視覚的な理解
momoseoyama
3
770
SSII2024 [OS2] GPT-4Vで画像認識は終わるのか(オープニング)
ssii
PRO
0
640
マルチモーダル学習ライブラリ Heronと⾃動運転への応⽤
yuyamaguchi
1
980
SSII2024 [PD] 30周年記念特別企画SSII 技術マップ / LLMサーベイ
ssii
PRO
0
630
AIが非ヒト動物に与える有益・有害な影響の検討
takeshit_m
0
290
ソースコード問い合わせのための長コンテキストLLM向けRAG手法の提案
toskamiya
0
140
JMED-LLM: 日本語医療LLM評価データセットの公開
fta98
1
350
Featured
See All Featured
Optimizing for Happiness
mojombo
373
69k
Code Review Best Practice
trishagee
58
16k
How to train your dragon (web standard)
notwaldorf
79
5.5k
Into the Great Unknown - MozCon
thekraken
20
1.3k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
78
15k
What’s in a name? Adding method to the madness
productmarketing
PRO
21
2.9k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
105
6.8k
Side Projects
sachag
451
42k
The Cost Of JavaScript in 2023
addyosmani
31
4.7k
Embracing the Ebb and Flow
colly
81
4.3k
10 Git Anti Patterns You Should be Aware of
lemiorhan
652
58k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
149
45k
Transcript
ಥવͰ͕͢””͍͍ͬͯͰ͔͢? Shinichi Nakagawa@shinyorke Baseball Play Study mini 2022/05/27
ຊͷςʔϚʮٿͱAIͱٕज़ʯ • ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεͱΞϧΰϦζϜ • ٿAIΛࢧ͑Δٕज़ - PythonͱGoogle CloudΛఴ͑ͯ • ٿAIͰ͍·͢,
ʮਪ͠ͷબखͷ5ઌʯ ͖͏ͷਓೳΛ࡞ͬͨͷͰҰॹʹ༡΅͏ͥ⽁ʢཁʣ
ࠓճͷ͍ʮଧऀͷʯͰ͢ खVer.ແ͘ͳ͍Ͱ͕͢, ݁Ռ͕ඍົͩͬͨͷͰଧऀͷΈͰΒ͍͖ͤͯͨͩ·͢🙏
Who am I ?ʢ͓લ୭Αʣ • Shinichi Nakagawaʢத ৳Ұʣ • େͷSNSͰʮshinyorkeʢ͠ΜΑʔ͘ʣʯͱ໊͍ͬͯ·͢
• ΞΫηϯνϡΞגࣜձࣾϚωʔδϟʔʢຊۀʣ • ຊۀͷํͰʮGoogle Cloudڧ͍ϚϯʯతͳཱͪҐஔͰ ιϦϡʔγϣϯΞʔΩςΫτʢSRE/DevOpsपΓʣ • ݸਓ׆ಈʮੜͷٿσʔλαΠΤϯςΟετʯͱͯ͠ ٿʹؔ͢ΔσʔλαΠΤϯεͱΤϯδχΞϦϯάΛ͍ͯ͠·͢ ʢ͔ͭ, ຊۀͰػցֶशΤϯδχΞɾσʔλαΠΤϯςΟετܦݧ͋Γʣ • ւಓຊϋϜϑΝΠλʔζ&ΦʔΫϥϯυɾΞεϨνοΫεͷϑΝϯ⽁
ຊͷଧॱ • ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεೖ • ٿAIΛ࣮͢Δ - Google CloudΛఴ͑ͯ • ಥવͰ͕͢””͍͍ͬͯͰ͔͢⽁
- ٿAIͰ
ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεೖ
ٿAIΛࢧ͑ΔηΠόʔϝτϦΫε • ηΠόʔϝτϦΫε #ͱ • ηΠόʔϝτϦΫεͷ͖΄Μ • ʮͦͬ͘Γ͞Μʯ͔Β༧ଌ - PECOTAϞσϧ
• shinyorke’s༧ଌϞσϧʮzobristʯվΊʮkenshiʯ શ෦͢ͱ3.34͔͔࣌ؒΔͷͰࠓ֓ཁͷΈհ🐯
ηΠόʔϝτϦΫε #ͱ • ٿʹ͓͍ͯൃੜ͢ΔσʔλΛ౷ܭֶతͳΞϓϩʔνͰੳΛߦ͍, ʮબखͷೳྗʯʮνʔϜͷڧ͞ʯͳͲநతͳ֓೦ΛఆྔతʹࢦඪԽ͠, νʔϜɾબखɾϑΝϯʹཱͯΔͨΊͷՊֶతͳΞϓϩʔνɾߟ͑ํͷ͜ͱ. • Ҏલσʔλ͕ओྲྀ͕ͩͬͨ,
ʮελοτΩϟετʯʮτϥοΫϚϯʯͱ͍ͬ ͨ, ܭଌػثτϥοΩϯάσʔλΛ༻͍ͯߦ͏ͷ͕ࠓͷτϨϯυ • ͳ͓, σʔλͷΈͰे͗͢Δ͙Β͍໘ന͍ࣄ͕ग़དྷ·͢ ʢ㲈τϥοΩϯάσʔλٿɾٕज़ڞʹઐ͕ࣝΘΕΔ&қߴ͍ʣ
ηΠόʔϝτϦΫεͷ͖΄Μ • ηΠόʔϝτϦΫεγϯϓϧͳ࢛ଇԋࢉ͓Αͼ౷ܭͰߦ͏ࣄ͕Ͱ͖Δ • Α͘ΒΕ͍ͯΔʮOPSʯʮWHIPSʯͳͲ, ࣜͦͷͷిExcelͰܭࢉ͕Մೳʢ㲈ϓϩάϥϛϯάෆཁʣ • Ұํ, ʮWARʯʮRCʯͳͲͷࢦඪܭࢉׂ͕ͱෳࡶ,
ExcelͰग़དྷͳ͘ແ͍͕, ϓϩάϥϛϯάSQL, ػցֶशͳͲͰॲཧͨ͠΄͏͕ྑ͍ύλʔϯଘࡏ͢Δ. • ༧ଌʮಛྔΤϯδχΞϦϯάʯͱͯ͠ѻ͏ͱ࣮ݱ͢Δ͜ͱ͕Ͱ͖Δʂ ʢͱ͍͏ͷ͕͜ͷൃදͷٕज़తͳςʔϚͰ͢ʣ
ٿσʔλΛಛྔʹม͢Δ ಛྔʢ㲈ʣʹมɾ୯ҐΛἧ͑Δಓͳ࡞ۀ͕ඞཁ • -> • ͦͷ··͑ΔϞϊ͕ଟ͍. ྫ͑҆ଧ, ࢛ٿ,
ࡾৼͳͲ. • Θ͔Γ͍͢୯Ґʹਖ਼نԽɾεέʔϦϯά͢Δ. RC, wRAA, wOBAͳͲͷηΠόʔϝτϦΫεࢦඪ. • Ҏ֎ͷσʔλ -> • ར͖ଧ੮ͷࠨӈ, ఱવࣳ or ਓࣳ, ֎ or υʔϜ or େࣗવʢॴͱݴ͍ͬͯͳ͍ʣ? • Ͱແ͍σʔλΛಛྔʹ͢ΔͨΊͷॲཧ͕ඞཁʢΧςΰϦʔʹ͢ΔͳͲʣ
ϓϩٿબखͷΛ͏ٕज़ • ༧ଌͦͷͷηΠόʔϝτϦΫεᴈ໌ظ͔Β͋Δఆ൪ωλͰ, ΞϝϦΧʹϑΝϯ͚ͷ༧ଌαΠτ͕͋Δ͙Β͍ͷΓ্͕Γ. • τϥοΩϯάσʔλ͕ओྲྀͷࠓͰબखͷ݈߁ཧύϑΥʔϚϯε ଌఆͳͲΛ௨ͯ͡কདྷͷύϑΥʔϚϯεΛ༧ଌ͢Δ͜ͱ. ※༧ଌͷݱ׆༻,
ͱݴ͑ΔʢPlayer’s Developmentʣ • ݹయత͔ͭදతͳ༧ଌϞσϧͱͯ͠, PECOTAʢϖίλʣ͕༗໊.
PECOTA - ࠷౷ܭతͳ༧ଌϞσϧ • 2003ʢ19લʣʹϦϦʔεͨ͠MLBͷ༧ଌϞσϧ • ʮաڈͷࣅ͍ͯΔબखͷʯ͔Β༧ଌΛࢉग़ ͳ͓۩ମతͳख๏ɾࣜඇެ։ʢߟ͑ํͪΒ΄Βॻ͍ͯ͋Δʣ •
ޙʹ2008ถࠃେ౷ྖબڍͷউऀΛ49/50भతதͤͨ͞ ౷ܭֶऀωΠτɾγϧόʔ͕։ൃ ※ؾʹͳΔํʮγάφϧ&ϊΠζʯͱ͍͏ॻ੶ΛಡΜͰ͍ͩ͘͞
ʮͦͬ͘Γ͞ΜʯΛ୳͢ࣄͰΛ༧ଌͰ͖Δ!? աڈϝδϟʔϦʔάͰσϏϡʔͨ͠બख2021·Ͱʹ20, 370ਓ͍ΔʢLahman’s Baseball Databaseௐʣ ͜Ε͚͍ͩΕ, ʮੲͷ͋ͷਓͬΆ͍ʯ͙Β͍ग़ͤΔͷͰͳ͔Ζ͏͔???
shinyorke’s༧ଌϞσϧʮkenshiʯര • աڈʢؚΉݱʣʹଘࡏͨ͠ٿબखͷΛݩʹ, ʮࣅ͍ͯΔબखΛΫϥελϦϯάʯ Ͱ͖ͨΒ༧ଌ࡞ΕΔͷͰ? -> ࣮PECOTA͜ͷΞϓϩʔνʢ࠷ॳظʣ • ηΠόʔϝτϦΫεͰʮྨࣅੑείΞʯͱ͍͏ࣅ͍ͯΔબखΛಋ͕ࣜ͋͘Δ͕,
೦ͳ͕Β͕ܽଟ͍ʢ௨ࢉͰΫϥελϦϯά͢ΔͨΊ, όΠΞε͕ڧ͘ग़Δʣ • ʮ͋ΔಛྔΛݩʹΫϥελϦϯάʯಛྔΤϯδχΞϦϯά͕ಘҙͳλεΫ ػցֶशతͳΞϓϩʔνͰߦ͚ΔͷͰ?આ -> Ͱ͖ͨ🙌 • ϝδϟʔϦʔά൛AIʮzobristʯΛ։ൃ -> ͍͍ײͩͬͨ͡ͷͰຊϓϩٿ൛Λ࡞ˡࠓ͜͜ ͜͏ͯ͠, shinyorke’sϓϩٿ༧ଌϞσϧ&ٿAIʮkenshiʯ͕ര.
ٿAIΛ࣮͢Δ - Google CloudΛఴ͑ͯ
ٿAIʮkenshiʯΛ࣮͢Δ • ΞʔΩςΫνϟͷશମ૾ • σʔλऔಘͱલॲཧ • ΞϧΰϦζϜΛܾΊͯΫϥελϦϯά • ༧ଌΛ፻͢Δੜ͢Δ ͪͳΈʹkenshi໊ͬͯલͷ༝དྷӈ྆ଧͷ͋ͷબखΑΓʢࠢʣ
ϓϩٿબख༧ଌϓϩμΫτશମ૾
ΞʔΩͷجຊํ • σʔλͯ͢BigQueryʹूΊΔʢ㲈Google CloudͰͯ͢ΛݻΊͨཧ༝ʣ • ֶशσʔλςετσʔλͯ͢BQ • ޙड़͢ΔલॲཧɾσʔλཧΛͳΔ͘SQLͰΓ͔ͨͬͨ • αʔόϨεͳαʔϏεΛத৺ʹબΜͰ͏ʢ㲈VMͰ͋Δඞཁ͕ແ͍ʣ
• ΞϓϦΫϩʔϥʔCI/CDαʔόϨεܥͷαʔϏεͰݻΊΔ • ʮͬͨʯ͚ͩඅ༻ʹͳΔͷͰࡒʹ༏͍͠&εέʔϦϯάָ
αϥοͱղઆ • Data Analytics • BigQuery͕ͯ͢ͷத৺, σʔλͯ͢͜͜ • Cloud ConsoleͰΫΤϦʔΛॻ͍ͯσʔληοτ࡞,
͍͠λεΫJupyter Lab্Ͱ࣮ࢪ • ωοτ͔Βऩू͢ΔσʔλʢCSVʣCloud Storageʹอଘ, Cloud FunctionsΛͬͯBigQueryʹExport • Web App • StreamlitʢޙͰղઆʣͰ࣮ͨ͠ΞϓϦΛCloud RunͰϗετ • CI/CDGitHub ActionsͰαΫοͱ
ϗϯτʹࡉ͔͍ٕज़ղઆϒϩάͰ https://shinyorke.hatenablog.com/entry/cloud-arch-serverless ࠓճͷൃද༻ͷ͓ֆ͔͖Ͱ͕ͨ͠ϒϩάͰόζͬͨ&ผͰৄͤ͘͠Εʂ
σʔλͷऔಘ • ֶशσʔλϝδϟʔϦʔάͷσʔλΛ༻ • Lahman’s Baseball Database • ্هσʔλϕʔεͷCSVσʔλΛBigQueryʹimport •
ϓϩٿͷσʔλBaseball Reference͔ΒεΫϨΠϐϯά • 2021γʔζϯऴྃ࣌ΛݩʹεΫϨΠϐϯά • Pythonͷrequests-htmlͰΫϩʔϥʔΛ࣮, CSVอଘ -> BigQuery
ϝδϟʔϦʔάͷσʔλΛͬͨཧ༝ • ຊͷϓϩٿͰ·ͱ·ͬͨσʔληοτ͕ଘࡏ͠ͳ͍ • ͋Δॴʹ͋Δ͕, ݖརతʹ͑Δ͔ո͍͠ • ϝδϟʔϦʔάΦʔϓϯσʔλ͕ॆ࣮͔ͭݖརେৎ • αϯϓϧσʔλͷେ͖͞ʢ100Ҏ্͋ΔͷͰे͗͢Δʣ
• ಉ͡ٿͱ͍͏ڝٕ͔ͭهมΘΒͳ͍ͷͰӨڹগͳ͍ͱஅ
લॲཧ • ֶशʹඞཁͳσʔλSQLͰՃ, Viewʹͯ͠อଘ →Google Cloud ConsoleͰ࣮ࢪ • Ͳ͏ͯ͠SQLͰ໘͍͘͞ͷΛPandasͳͲͰॲཧ
→ࣗͷPC্ʹ࡞ͬͨJupyter LabڥͰ࣮ࢪ • ֶशʹඞཁͳ௨ࢉɾผΛࢉग़͢ΔͨΊͷ ΫΤϦʔσʔληοτΛͻͨ͢Β࡞Γ·ͬͨ͘
લॲཧͷྫ - SQLͰߦ͏ٿͷಛྔநग़ • ଧ, ग़ྥ, OPSతͳͷ SQLͰܭࢉͰ͖Δ. •
͏ͪΐͬͱෳࡶͳࢦඪ. ྫ͑wOBAͱ͔. • ্هBigQueryͰ݁͠·ͨ͠.
લॲཧͷྫ - SQLͰߦ͑ͳ͍ͷ? • ࡶͳॲཧɾܭࢉ͕ೖͬͨΓ, ߦྻͰ·ͱ·ͬͨϞϊͷॲཧ PythonRͰॲཧ͕ϕετ. •
ྫ͑ϐϘοτςʔϒϧ, άϧʔϐϯάͳͲPandasͰ ॻ͍ͨ΄͏͕Θ͔Γ͍͢ ͱ͖͋Δʢॾઆ͋Γ·͢ʣ • SQL͕ۤखͳํશ෦ͬͪ͜Ͱͬͯྑ͍͔.
ΞϧΰϦζϜΛܾΊͯΫϥελϦϯά • ʮࣅ͍ͯΔબखʯΛྨ͢ΔλεΫ • ΞϧΰϦζϜΛܾΊΔˠ࠷ऴతʹANNʹ • AnnoyʢΞϊΠʔʣͰരANN ྨλεΫΛ࡞Γ, ςετΛॻ͖, γϡοͱCIͰ࠶࣮ߦՄೳʹ.
ࣅ͍ͯΔબखΛ୳͢ɾྨ͢Δ • ௨ࢉͱकඋҐஔ͝ͱͷग़ճΛಛྔͱ͢Δ͜ͱʹΑΓ, ʮࣅ͍ͯΔબखʯΛ୳͢͜ͱ͕ՄೳͳͷͰ? • ಛྔΛͬͯΫϥελϦϯάͯ͠ڑΛܭଌ, ͍ۙॱͰϥϯΩϯάԽ͢ΔʢϢʔΫϦουڑͳͲͰʣ •
ͳ͓, PECOTAʢ͓ͦΒ͘ʣߟ͑ํಉ͡.
ANNʢۙࣅ࠷ۙ୳ࡧʣΛ࠾༻ • ग़ࢼ߹, ଧ੮, ओཁͳଧܸʢ҆ଧ, ຊྥଧ, ଧ, etc…ʣ • कඋҐஔʢશ9ϙδγϣϯ,
DHߟྀ͠ͳ͍ʣผͷग़ճ • ্هΛಛྔͱͯ͠ANNʢۙࣅ࠷ۙ୳ࡧʣΛ͔ͭͬͯ ϢʔΫϦουڑΛࢉग़͠, ͍ۙબखΛूΊΔ͜ͱʹ. • ʮAIʹΑΔࣆδϟύϯબग़ʯͱ͍͏ωλͰར༻->݁Ռ্ʑ https://shinyorke.hatenablog.com/entry/tokyo2020-samurai-japan • ࣮Annoyͱ͍͏ศརͳϥΠϒϥϦΛ͍·ͨ͠.
AnnoyΛͬͨANNʹΑΔΫϥελϦϯά. ूΊͨσʔλΛ͠ࠐΜͰΔ͜ͱͰΫϥελϦϯά͕Ͱ͖·ͨ͠.
݁ՌΛݟͯΈͨ • ΦϦοΫε٢ాਖ਼ঘʹࣅ͍ͯΔਓΛ୳͢ • ༧ଌϞσϧʹ٢ాਖ਼ঘͷΛͯ͠ ΫϥελϦϯά݁ՌΛௐࠪ • ϋϯΫɾΞʔϩϯ, ΟϦʔɾϝΠζ,
ήϨʔϩଞ, ࣅ͍ͯΔ֎ख͕औΕͨͷͰ ޭͱݴ͑ͦ͏🎉 ※ήϨʔϩڈΦΦλχαϯͱHRԦ૪͍ͨ͠ήϨʔϩJr.ͷ͓͞Μ
༧ଌͷग़͠ํ • ΫϥελϦϯάͷ݁Ռ, ্ҐʹϥϯΩϯά͞Εͨબखͷ ྸผΛऔಘ • ྸผͷฏۉύʔηϯλΠϧΛࢼͯ͠, ऩ·Γͷྑ͍ࣈʹ͢Δ
• ଧɾ҆ଧͳͲʮੵΈॏͶʯͷΛ༧ଌޙ, ଧͳͲͷʮʯΛද͢Λܭࢉ
ϓϩμΫτʹ͢Δ • ͻͱ·࣮ͣݧతͳΞϓϦέʔγϣϯΛ StreamlitͰ࣮ • StreamlitҰݴͰݴ͏ͱ ʮJupyter notebookΛΞϓϦʹ͢Δʯ
ͨΊͷFramework • Dockerίϯςφʹͯ͠ Cloud RunͰϗεςΟϯά
ಥવͰ͕͢””͍͍ͬͯͰ͔͢?
AIͰ͏ʮࠓ, ؾʹͳΔϓϩٿબखʯ • ݱࡏઈௐ, ޥͷ͋ͷਓ • ೋ಄ཽʢೋྲྀʣͤ͞Δඞཁ͋Δͷ͔ແ͍ͷ͔? • BIG BOSSʹࣅͯΔʢ͔͠Εͳ͍ʣ͋ͷબख
ຊ12ٿஂ৮Ε͍ͨ…Ͱ͕࣌ؒ͢ͷ߹ʹΑΓ🙏
ઈௐͳޥͷ͋ͷਓͱ͍͑ • ࡔ কޗʢౡʣ - 2016υϥϑτ4Ґ • ࡢ͍ͭʹϒϨΠΫ, ࠓ͜͜·Ͱଧരൃ •
ϝΠϯัख͕ͩकΕΔϢʔςΟϦςΟ
͜ΕΤά͍ະདྷ༧ਤʢੌʣ
ࡔ কޗબखͷະདྷ • ࠓͷ༧ʮଧ.309 ຊྥଧ20ຊ ଧ70 OPS .903ʯ • ڈͷงғؾ͔Β͢ΔͱϦΞϧʹୡՄೳͳ༧ײ͕!?
• ݸਓతʹͬͺัखͬͯ΄͍͠, νʔϜࣄͳΜ͚ͩΕͲ ʢଧͯΔัख͍Δ͚ͩͰΞυόϯςʔδେ͖͍ʣ
ཽͷະདྷΛ͏ - ೋਓͷཽઓ࢜ • AɾϚϧςΟωεʢதʣ - 2018ೖஂ • ࠜඌ ߉ʢதʣ
- 2018υϥϑτ1Ґ • ଧ͓ΑͼೋྲྀͰͪΐͬͱΛݺΜͰ͍ΔೋਓΛ͏
ཽͷະདྷ໌Δ͍͔?
AɾϚϧςΟωεબखͷະདྷ • ࠓͷ༧ʮଧ.290 ຊྥଧ10ຊ ଧ44 OPS .862ʯ • OPSҎ֎ຊؾͰୟ͖ग़ͦ͠͏ͳࣈͳؾ͕͢Δ? •
ཉΛݴ͑֎͡Όͳͯ͘ัखͰग़ͯ΄͍͠ ัखͰ͜Ε͚ͩଧͬͨΒࠓͷٿͩͱੌ͍͜ͱʹ
ͳΔ΄Ͳ?
ࠜඌ ߉બखͷະདྷ • ࠓͷ༧ʮଧ.244 ຊྥଧ1ຊ ଧ6 OPS .654ʯ 5ޙ·Ͱͷ༧ଌ…͏ʔʔΜ?
• ඇৗʹौ͍ධՁ, ೋྲྀΛࢼ͢ҙຯ༧ଌ͚ͩͩͱ͋Γͦ͏? • ൩ܕͱ৴͍ͨ͡, ͍͘ΒͳΜͰٿAIͷධՁ͕ौ͗͢? ͪͳΈʹ౻ݪ ګେʢϩοςʣͳ͔ͳ͔ौ͍ධՁʹ
BIG BOSSͷޙܧऀ୭ͩ? • ສ தਖ਼ʢຊϋϜʣ - 2018υϥϑτ4Ґ • ύϫʔͱεϐʔυ, ࡶ͞Λ݉Ͷἧ͑ͨϑΟδΧϧϞϯελʔ
ϑϧεΠϯάͰ͔ͬඈ͢ଧܸͱڧݞΛੜ͔ͨ͠कඋ ݱ࣌ͷBIG BOSSͦͷͷ • ࢲ, shinyorke͕ࠓ࠷ਪ͍ͯ͠Δϓϩٿબख
ࢥͬͨΑΓBIG BOSSͬΆ͞?
ສ தਖ਼બखͷະདྷ • ࠓͷ༧ʮଧ.252 ຊྥଧ18ຊ ଧ52 OPS .780ʯ • ϗϯτʹୟ͖ग़ͦ͠͏ͳࣈ,
ग़ػձ&ଧ࣍ୈͰ ͳΜͩͬͨΒຊྥଧ༧ଌ௨Γ͔ͨ͠͠Β͔͢? • 5ޙʹOPS.900͑Β͍͠ͷͰ, ͜ͷ͍ͨͬͯཉ͍͠
ͪͳΈʹ, ϓϩτλΠϓͰ࡞ͬͨ ผͷAIϞσϧ͕มͳ༧ଌͯ͠·ͨ͠ ʢࠓճVer.Ͱ͍͟͝·ͤΜʣ
ສ தਖ਼ͱBIG BOSS ଧ ຊྥଧ ଧ #*(#044ࡀ ʢɾࡕਆʣ
ຊ ଧ ສதਖ਼ࡀ ʢͷ༧ଌʣ ຊ ଧ ΊͬͪΌ৽ঙ߶ࢤબखΜʂʂʂ
͖͏AIͰBIG BOSSͷޙܧऀ, ݟ͚ͭ·ͨ͠ʢ͜ͳΈʣ
݁ͼ
͖͏AIͷ՝ͱ࣍ͷςʔϚ • ৽ਓબखͷ༧ଌ͕ʢϞσϧͷ্༷ʣͰ͖ͳ͍ • ݱϞσϧ௨ࢉϕʔεͰͷֶश&༧ଌͰ͋ΔͨΊ, ࣮ແ͍ϧʔΩʔͷ༧ଌ͕ग़དྷͳ͍ • ߴߍɾେֶͷΛͦͷ··͑…ͱ͍͏୯७ͳղܾ͕Ͱ͖ͳ͍ • Ҏ֎ͷઆ໌มΛՃ͍͑ͨ
• ͬͺΓτϥοΩϯάσʔλ͍͍ͨʂ͋ͱମ֨ͱ͔ • ຊϓϩٿͰΔखஈແ͍͕, ϝδϟʔϦʔάBaseball SavantͰ͍͚ΔͷͰҾ͖ଓ͖AIΛҭ͍͖͍ͯͯͨ • ख൛͕͋Μ·Γ͓͠Ζ͘ͳ͔ͬͨͷ͕չ͍͠ • ҰԠ͋ΔͷͰ͕͢, ඍົͩͬͨͷͰൃද߇͑·ͨ͠, ࠤʑ ࿕رͷະདྷ༧ਤݟͯΈ͍ͨͷͰ͏গ͕͠ΜΓ·͢. • ݱ࣮తʹ, ϓϩٿͰΓͳ͍ಛྔ͕͋Γ·ͯ͠…ϝδϟʔϦʔά൛े࣮༻ʹת͑ΔͷͰ͕͢😇
࣍ͷల։ • ͍ʢ༧ଌʣαΠτͷ্ཱͪ͛. σʔλͷݖརͱ͔ॾʑ্ख͘ղ্ܾͨ͠Ͱʢଟ͍͚Δͱࢥ͏ʣ. • ༧ଌΞϧΰϦζϜͷվྑ. ϝδϟʔϦʔά൛ͰτϥοΩϯάσʔλΛͬͨϞσϧͷ։ൃ. •
PyCon JP 2023ͱ͔, ϦΞϧ։࠵ͷBaseball Play StudyͰ·ͨձ͓͏.
ಥવͰ͕͢””͍͍ͬͯͰ͔͢? • ٿAIηΠόʔϝτϦΫεͱػցֶशͷԠ༻Ͱ࣮Մೳ • ٿAIBigQueryPythonͰ࡞ΕΔ • ัखัखΛΔ͖Ͱ, ϚϯνϡBIG BOSSͷޙܧऀ ·ͩ·ͩ༡΅͏ͱࢥ͍·͢ͷͰҾ͖ଓ͖ΑΖ͘͠ʂ
ήʔϜηοτ ͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ Shinichi Nakagawa(Twitter/Facebook/etc… @shinyorke)