競馬予測の考え方

競馬予測の考え方 @stockedge 1

自己紹介本名　森一生個人事業主です。Web制作、機械学習、自然言語処理、etc。個人的に（趣味で）作成したWebサイトなど。 2 推奨銘柄無料公開ブログ家賃相場

今年の正月に書いた記事 10万PV以上のアクセスがありました。 3

ちなみに… ブログでは偉そうなこと書いてますが競馬に関しては素人ですツッコミ大歓迎！ 4

今日は競馬予測の考え方について話します 1. 戦略について 2. モデルについて 3. 評価方法について 5

１．戦略について 6

Ｑ．そもそも、なぜ予測するのか？ 7

Ａ．お金を儲けたいから！ 8

お金を儲けるためには… ただ単に良い予測をするだけではだめ他の人より良い予測をしなければならない！戦略的に考えよう 9

自分の強みを考えよう我々の強みプログラミングの知識機械学習の知識 10

プログラミングで出来ること手間のかかる作業の自動化 11

分析するのに手間のかかる特徴量を使おう！例：親馬や兄弟馬の成績、時系列オッズなど 12 だから…

注意点闇雲に手間をかければいいというものではない分析しても無駄な特徴量もあるので… 徒労を避けるためには競馬の知識が必要 13

機械学習で出来ること色々な特徴量を総合的に考慮できる 14 脚質、オッズ、血統、騎手、etc

既存の競馬予想方法の問題点既存の競馬予想方法は特定の特徴量にだけ着目するものが多い使える特徴量は全て使おう！ 15

強みを自覚して戦略的に使おう！我々の強みはプログラミングの知識機械学習の知識積極的に活用しよう！ 16

２．モデルについて 17

モデルを作る前にデータをきれいにしておこう新馬戦、障害戦は除外出走取消、競争除外も除外正規化（平均０分散１にする） etc... 18

私が競馬予測のために作ったモデル使用した特徴量は67個前述のとおり手間のかかる特徴量を多く取り入れた線形モデルでモデル化過学習が怖かったのでシンプルなモデルを使った 19

モデルについてもう少し詳しくはおいしさ指数はi番目の特徴量はパラメータ 20 つまり「勝ち馬」ではなく「儲かる馬」を予測

なぜ線形モデルを使う？理由１既に卍氏が線形モデルで成功している理由２シンプルなモデルなので過学習しにくい 21

モデルをどう学習させるかモデルの学習とはのを最適化すること目的関数は回収率の最大化 22

最適化手法勾配計算が不要な手法なら何でもＯＫ私はCMA-ESを使っていた（過去形）あるいは今流行のBayesian Optimizationとか 23

勝ち馬の予測はだめ？「1着になる確率」を予測「投票率」を予測し「1着になる確率」と比較二つの問題を解く必要がある私は複雑な問題が苦手なのでやめた 24

３．評価方法について 25

モデルの評価方法ローリングウィンドウ法を使う 26 学習テスト学習テスト学習テスト学習
テスト

回収率の高さが最重要、というわけではないもちろん回収率が100%を超えていないと賭ける意味はないのだが… 回収率120%だが年一回しか賭けるチャンスが無い方法回収率101%だが毎週賭けるチャンスがある方法トータルで考えたら後者の方が良い！ 27

リスクの評価も忘れずにリスクとはリターンの分散のことリスク大リスク小 28

特徴量に確定オッズを含めないようにしよう特徴量に確定オッズを含んでいる場合パフォーマンスが過大評価される（経験済み）現在は投票締め切り30分前のオッズを使用 29 JRA等から取得可能

賭け金の決め方卍氏と同じ投資法をそのまま採用賭け金 = 資金残高 * 0.1 / 30分前オッズ収支が安定するのでリスクを減らせる
30

実際にどれぐらいのパフォーマンスがでるか過去10年分のデータ（37万件）を使って実験した学習データ5万件、テストデータ1万件ローリングウィンドウ法で学習とテストを31回繰り返した 31 おいしさ指数平均リターン標準偏差最大ドローダウン買い目割合
0以上 0.028% 3.128% 99.9% 51% 10以上 0.047% 3.169% 99.9% 35% 20以上 0.066% 3.217% 98.0% 21% 30以上 0.083% 3.259% 98.4% 11% 40以上 0.136% 3.336% 83.1% 5%

問題点ドローダウン大きすぎ資金配分を追い下げにすれば破産はしないはずマーケットインパクトを考えていない重賞レースなど投票数が多いレースにだけ賭ける 32

これで完成というわけではないまだ分析ができていない特徴量があるリスクが高いのも何とかしたい年内中には何かしらの形で公開予定 33

ご清聴ありがとうございました 34

競馬予測の考え方

競馬予測の考え方

Issei Mori

Other Decks in Programming

Featured

Transcript