Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
競馬予測の考え方
Search
Issei Mori
June 14, 2016
Programming
6.4k
2
Share
競馬予測の考え方
ウマナリティクス #1 で発表したときの資料です。
Issei Mori
June 14, 2016
Other Decks in Programming
See All in Programming
RTSPクライアントを自作してみた話
simotin13
0
190
権限チェックの一貫性を型で守る TypeScript による多層防御
mnch
4
630
AI駆動開発勉強会 広島支部 第一回勉強会 AI駆動開発概要とワークショップ
hayatoshimiu
0
380
Copilot CLI の継戦能力を高める コンテキスト管理
nozomutu
1
1k
CLIであることを活かしたGitHub Copilot CLI活用術 / GitHub Copilot CLI Pro Tips & Tricks
nao_mk2
1
1.1k
New "Type" system on PicoRuby
pocke
1
180
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
330
~ 秘伝のタレ化した『神スプシ』と戦う ~ 関数型パラダイムで壊れない仕組みへ
h0r15h0
1
130
Stage 3 Decorators でできること / できないこと / TSKaigi 2026
susisu
1
1.1k
AI時代になぜ書くのか
mutsumix
0
460
AlarmKitで明後日起きれるアラームアプリを作る
trickart
0
150
Composerを使ったサプライチェーン攻撃の様子を眺めてみる #phpstudy
o0h
PRO
2
160
Featured
See All Featured
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
Designing for Performance
lara
611
70k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Claude Code のすすめ
schroneko
67
220k
Utilizing Notion as your number one productivity tool
mfonobong
4
310
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
300
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
120
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
Producing Creativity
orderedlist
PRO
348
40k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
54k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
340
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
Transcript
競馬予測の考え方 @stockedge 1
自己紹介 本名 森 一生 個人事業主です。Web制作、機械学習、自然言語処理、etc。 個人的に(趣味で)作成したWebサイトなど。 2 推奨銘柄無料公開ブログ 家賃相場
今年の正月に書いた記事 10万PV以上のアクセスがありました。 3
ちなみに… ブログでは偉そうなこと書いてますが 競馬に関しては素人です ツッコミ大歓迎! 4
今日は競馬予測の考え方について話します 1. 戦略について 2. モデルについて 3. 評価方法について 5
1.戦略について 6
Q.そもそも、なぜ予測するのか? 7
A.お金を儲けたいから! 8
お金を儲けるためには… ただ単に良い予測をするだけではだめ 他の人より良い予測をしなければならない! 戦略的に考えよう 9
自分の強みを考えよう 我々の強み プログラミングの知識 機械学習の知識 10
プログラミングで出来ること 手間のかかる作業の自動化 11
分析するのに手間のかかる特徴量を使おう! 例:親馬や兄弟馬の成績、時系列オッズなど 12 だから…
注意点 闇雲に手間をかければいいというものではない 分析しても無駄な特徴量もあるので… 徒労を避けるためには競馬の知識が必要 13
機械学習で出来ること 色々な特徴量を総合的に考慮できる 14 脚質、オッズ、血統、騎手、etc
既存の競馬予想方法の問題点 既存の競馬予想方法は 特定の特徴量にだけ着目するものが多い 使える特徴量は全て使おう! 15
強みを自覚して戦略的に使おう! 我々の強みは プログラミングの知識 機械学習の知識 積極的に活用しよう! 16
2.モデルについて 17
モデルを作る前にデータをきれいにしておこう 新馬戦、障害戦は除外 出走取消、競争除外も除外 正規化(平均0分散1にする) etc... 18
私が競馬予測のために作ったモデル 使用した特徴量は67個 前述のとおり手間のかかる特徴量を多く取り入れた 線形モデルでモデル化 過学習が怖かったのでシンプルなモデルを使った 19
モデルについてもう少し詳しく はおいしさ指数 はi番目の特徴量 はパラメータ 20 つまり 「勝ち馬」ではなく 「儲かる馬」を予測
なぜ線形モデルを使う? 理由1 既に卍氏が線形モデルで成功している 理由2 シンプルなモデルなので過学習しにくい 21
モデルをどう学習させるか モデルの学習とは の を最適化すること 目的関数は回収率の最大化 22
最適化手法 勾配計算が不要な手法なら何でもOK 私はCMA-ESを使っていた(過去形) あるいは今流行のBayesian Optimizationとか 23
勝ち馬の予測はだめ? 「1着になる確率」を予測 「投票率」を予測し「1着になる確率」と比較 二つの問題を解く必要がある 私は複雑な問題が苦手なのでやめた 24
3.評価方法について 25
モデルの評価方法 ローリングウィンドウ法を使う 26 学習 テスト 学習 テスト 学習 テスト 学習
テスト
回収率の高さが最重要、というわけではない もちろん回収率が100%を超えていないと賭ける意味はないのだが… 回収率120%だが年一回しか賭けるチャンスが無い方法 回収率101%だが毎週賭けるチャンスがある方法 トータルで考えたら後者の方が良い! 27
リスクの評価も忘れずに リスクとはリターンの分散のこと リスク大 リスク小 28
特徴量に確定オッズを含めないようにしよう 特徴量に確定オッズを含んでいる場合 パフォーマンスが過大評価される(経験済み) 現在は投票締め切り30分前のオッズを使用 29 JRA等から取得可能
賭け金の決め方 卍氏と同じ投資法をそのまま採用 賭け金 = 資金残高 * 0.1 / 30分前オッズ 収支が安定するのでリスクを減らせる
30
実際にどれぐらいのパフォーマンスがでるか 過去10年分のデータ(37万件)を使って実験した 学習データ5万件、テストデータ1万件 ローリングウィンドウ法で学習とテストを31回繰り返した 31 おいしさ指数 平均リターン 標準偏差 最大ドローダウン 買い目割合
0以上 0.028% 3.128% 99.9% 51% 10以上 0.047% 3.169% 99.9% 35% 20以上 0.066% 3.217% 98.0% 21% 30以上 0.083% 3.259% 98.4% 11% 40以上 0.136% 3.336% 83.1% 5%
問題点 ドローダウン大きすぎ 資金配分を追い下げにすれば破産はしないはず マーケットインパクトを考えていない 重賞レースなど投票数が多いレースにだけ賭ける 32
これで完成というわけではない まだ分析ができていない特徴量がある リスクが高いのも何とかしたい 年内中には何かしらの形で公開予定 33
ご清聴ありがとうございました 34