Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Sports Analyst Meetup #5 LT - 目指せPGAツアー賞金王
Search
OpenJNY
November 02, 2019
Science
1
1.2k
Sports Analyst Meetup #5 LT - 目指せPGAツアー賞金王
PGA Tour データを GLM/GAM で簡単に分析してみました。
OpenJNY
November 02, 2019
Tweet
Share
More Decks by OpenJNY
See All by OpenJNY
Linux Networking Tools: 101
openjny
63
18k
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
openjny
11
3.2k
NSG フローログを支える技術 - NVF Advanced Flow Logging
openjny
1
890
グラフ分析ナイト - グラフデータ分析 入門編
openjny
2
1k
Representation Learning for Scale-free Networks: スケールフリーネットワークに対する表現学習
openjny
0
90
A Degeneracy Framework for Graph Similarity: グラフ類似度のための縮退フレームワーク
openjny
0
380
Handbook of Knowledge Representation - Chapter 2: Satisfiability Solvers
openjny
0
180
Other Decks in Science
See All in Science
深層学習を用いた根菜類の個数カウントによる収量推定法の開発
kentaitakura
0
210
生成AIと学ぶPythonデータ分析再入門-Pythonによるクラスタリング・可視化をサクサク実施-
datascientistsociety
PRO
4
1.8k
生成検索エンジン最適化に関する研究の紹介
ynakano
2
1.4k
風の力で振れ幅が大きくなる振り子!? 〜タコマナローズ橋はなぜ落ちたのか〜
syotasasaki593876
1
130
Symfony Console Facelift
chalasr
2
490
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
0
120
AIに仕事を奪われる 最初の医師たちへ
ikora128
0
990
データベース12: 正規化(2/2) - データ従属性に基づく正規化
trycycle
PRO
0
1k
Vibecoding for Product Managers
ibknadedeji
0
110
データマイニング - ウェブとグラフ
trycycle
PRO
0
200
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
1.6k
防災デジタル分野での官民共創の取り組み (1)防災DX官民共創をどう進めるか
ditccsugii
0
360
Featured
See All Featured
Site-Speed That Sticks
csswizardry
13
960
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
24
1.6k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
31
2.7k
GraphQLとの向き合い方2022年版
quramy
49
14k
The Language of Interfaces
destraynor
162
25k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
How GitHub (no longer) Works
holman
315
140k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
We Have a Design System, Now What?
morganepeng
54
7.9k
Making Projects Easy
brettharned
120
6.5k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Transcript
目指せ PGA ツアー賞金王
$ about-me . ├── 山口順也 (Junya Yamaguchi) │ ├── @OpenJNY
│ ├── 某パブリッククラウドで Support Eng. やってます (新卒 1 年目) │ └── Networking の勉強中 (LB, WAF, etc) └── 東京工業大学・大学院で人工知能基礎と機械学習を勉強してました ├── 理論よりの本 (e.g. PRML, MLaPP) が好き ├── 卒論は「SAT ソルバ × GPGPU」 ├── 修論は「SAT ソルバ × グラフ埋め込み」 └── Kaggle はやってません グラフ埋め込みは、めちゃくちゃおもしろい&今ホットなト ピックなので、興味あるかたいれば是非説明したい内容
None
None
LT テーマ: PGA ツアーの stats を GLM/GAM で分析してみる - https://www.kaggle.com/bradklassen/pga-tour-20102018-data
- LT の目的: - Python の GAM ライブラリ pyGAM を知る - PGA ツアーで賞金王になるための知見をゴル活に活かす - ノートブックは以下の URL で公開しています - https://www.kaggle.com/juyamagu/pga-tour-analysis-by-gam
背景: モデルの入力次元と解釈性 - 3 以上の次元を持つ入力を扱う関数は、人 間が視覚的に解釈できない - なので解釈可能にするには、入力を 1 次
元ないしは 2 次元に抑える必要がある - 複数の入力を一気に扱う機械学習モデ ル (e.g. DNN) などは解釈できない… N/A 2 次元以下の入力の関数を 組み合わせたモデルなら視覚的に解釈可能
GLM と GAM • 一般化線形モデル (Generalized Linear Model; GLM) •
一般化加法モデル (Generalized Linear Model; GLM) GLM の詳細は緑本や MLaPP 9章、GAM の詳細はカステラ本 9章を参照くださいm(_ _)m Hastie, T. J.; Tibshirani, R. J. (1990) Nelder, J.; Wedderburn, R. (1972)
pyGAM https://pygam.readthedocs.io/en/latest/
$ pip install pygam
None
データ概観: スキーマ カラム名 説明 PlayerName 名前 Season 年度 Money 年間獲得賞金
($) DrivingDistance 平均ドライバー飛距離 (yard) DrivingAccuracy フェアウェイ キープ率 DistanceEfficiency 飛距離/スピードの平均 NonDrivingDistance 平地での平均飛距離 (yard) カラム名 説明 BallSpeed ボールの平均スピード ScramblingSand バンカーからのスクランブル率 ScramblingFringe フリンジからのスクランブル率 ScramblingRough ラフからのスクランブル率 ThreePutRate スリーパットを叩いたホール率 BirdieConversion バーディ以上のホール率
データ概観: 相関係数 賞金と正の相関が強いもの - ドライバーの距離 - 飛距離の効率性 (スピン量) - ボールスピード
- ラフからのリカバリの上手さ - バーディよりよい成績でホールを終える 率 賞金と負の相関が認められるもの - ドライバー以外のショット飛距離 - 3 パットするホールの割合
PyGAM: GLM による Money 予測
None
PyGAM: GAM による Money の予測 l (Linear) を s (Spline)
に置換するだけ
None
GAM の表現力の豊かさ GLM GAM 一般化加法モデル 一般化線形モデル ✓ BirdieConversion (バーディより良い成績のホー ル率)
が大きいほど、賞金が稼げる傾向にある ✓ BirdieConversion (バーディより良い成績のホー ル率) が大きいほど、賞金が稼げる傾向にある ✓ ただし33 パーセント付近に「大きな壁」の存在 ✓ < 33% だと、賞金の伸びは限定的 ✓ 壁を超えると一気に賞金獲得の期待が高まる
None
含意
None