Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Sports Analyst Meetup #5 LT - 目指せPGAツアー賞金王
Search
OpenJNY
November 02, 2019
Science
1
1.1k
Sports Analyst Meetup #5 LT - 目指せPGAツアー賞金王
PGA Tour データを GLM/GAM で簡単に分析してみました。
OpenJNY
November 02, 2019
Tweet
Share
More Decks by OpenJNY
See All by OpenJNY
Linux Networking Tools: 101
openjny
63
17k
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
openjny
11
3k
NSG フローログを支える技術 - NVF Advanced Flow Logging
openjny
1
800
グラフ分析ナイト - グラフデータ分析 入門編
openjny
2
950
Representation Learning for Scale-free Networks: スケールフリーネットワークに対する表現学習
openjny
0
58
A Degeneracy Framework for Graph Similarity: グラフ類似度のための縮退フレームワーク
openjny
0
240
Handbook of Knowledge Representation - Chapter 2: Satisfiability Solvers
openjny
0
130
Other Decks in Science
See All in Science
Science of Scienceおよび科学計量学に関する研究論文の俯瞰可視化_ポスター版
hayataka88
0
150
The thin line between reconstruction, classification, and hallucination in brain decoding
ykamit
1
1k
生成AI による論文執筆サポートの手引き(ワークショップ) / A guide to supporting dissertation writing with generative AI (workshop)
ks91
PRO
0
320
MoveItを使った産業用ロボット向け動作作成方法の紹介 / Introduction to creating motion for industrial robots using MoveIt
ry0_ka
0
190
白金鉱業Meetup Vol.15 DMLによる条件付処置効果の推定_sotaroIZUMI_20240919
brainpadpr
2
590
JSol'Ex : traitement d'images solaires en Java
melix
0
120
拡散モデルの概要 −§2. スコアベースモデルについて−
nearme_tech
PRO
0
690
20240420 Global Azure 2024 | Azure Migrate でデータセンターのサーバーを評価&移行してみる
olivia_0707
2
930
山形とさくらんぼに関するレクチャー(YG-900)
07jp27
1
230
Machine Learning for Materials (Lecture 9)
aronwalsh
0
240
(Forkwell Library #48)『詳解 インシデントレスポンス』で学び倒すブルーチーム技術
scientia
2
1.4k
眼科AIコンテスト2024_特別賞_6位Solution
pon0matsu
0
220
Featured
See All Featured
Scaling GitHub
holman
458
140k
StorybookのUI Testing Handbookを読んだ
zakiyama
27
5.3k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Writing Fast Ruby
sferik
628
61k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
665
120k
Optimizing for Happiness
mojombo
376
70k
How To Stay Up To Date on Web Technology
chriscoyier
789
250k
YesSQL, Process and Tooling at Scale
rocio
169
14k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
48
2.2k
Building Your Own Lightsaber
phodgson
103
6.1k
How to Ace a Technical Interview
jacobian
276
23k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Transcript
目指せ PGA ツアー賞金王
$ about-me . ├── 山口順也 (Junya Yamaguchi) │ ├── @OpenJNY
│ ├── 某パブリッククラウドで Support Eng. やってます (新卒 1 年目) │ └── Networking の勉強中 (LB, WAF, etc) └── 東京工業大学・大学院で人工知能基礎と機械学習を勉強してました ├── 理論よりの本 (e.g. PRML, MLaPP) が好き ├── 卒論は「SAT ソルバ × GPGPU」 ├── 修論は「SAT ソルバ × グラフ埋め込み」 └── Kaggle はやってません グラフ埋め込みは、めちゃくちゃおもしろい&今ホットなト ピックなので、興味あるかたいれば是非説明したい内容
None
None
LT テーマ: PGA ツアーの stats を GLM/GAM で分析してみる - https://www.kaggle.com/bradklassen/pga-tour-20102018-data
- LT の目的: - Python の GAM ライブラリ pyGAM を知る - PGA ツアーで賞金王になるための知見をゴル活に活かす - ノートブックは以下の URL で公開しています - https://www.kaggle.com/juyamagu/pga-tour-analysis-by-gam
背景: モデルの入力次元と解釈性 - 3 以上の次元を持つ入力を扱う関数は、人 間が視覚的に解釈できない - なので解釈可能にするには、入力を 1 次
元ないしは 2 次元に抑える必要がある - 複数の入力を一気に扱う機械学習モデ ル (e.g. DNN) などは解釈できない… N/A 2 次元以下の入力の関数を 組み合わせたモデルなら視覚的に解釈可能
GLM と GAM • 一般化線形モデル (Generalized Linear Model; GLM) •
一般化加法モデル (Generalized Linear Model; GLM) GLM の詳細は緑本や MLaPP 9章、GAM の詳細はカステラ本 9章を参照くださいm(_ _)m Hastie, T. J.; Tibshirani, R. J. (1990) Nelder, J.; Wedderburn, R. (1972)
pyGAM https://pygam.readthedocs.io/en/latest/
$ pip install pygam
None
データ概観: スキーマ カラム名 説明 PlayerName 名前 Season 年度 Money 年間獲得賞金
($) DrivingDistance 平均ドライバー飛距離 (yard) DrivingAccuracy フェアウェイ キープ率 DistanceEfficiency 飛距離/スピードの平均 NonDrivingDistance 平地での平均飛距離 (yard) カラム名 説明 BallSpeed ボールの平均スピード ScramblingSand バンカーからのスクランブル率 ScramblingFringe フリンジからのスクランブル率 ScramblingRough ラフからのスクランブル率 ThreePutRate スリーパットを叩いたホール率 BirdieConversion バーディ以上のホール率
データ概観: 相関係数 賞金と正の相関が強いもの - ドライバーの距離 - 飛距離の効率性 (スピン量) - ボールスピード
- ラフからのリカバリの上手さ - バーディよりよい成績でホールを終える 率 賞金と負の相関が認められるもの - ドライバー以外のショット飛距離 - 3 パットするホールの割合
PyGAM: GLM による Money 予測
None
PyGAM: GAM による Money の予測 l (Linear) を s (Spline)
に置換するだけ
None
GAM の表現力の豊かさ GLM GAM 一般化加法モデル 一般化線形モデル ✓ BirdieConversion (バーディより良い成績のホー ル率)
が大きいほど、賞金が稼げる傾向にある ✓ BirdieConversion (バーディより良い成績のホー ル率) が大きいほど、賞金が稼げる傾向にある ✓ ただし33 パーセント付近に「大きな壁」の存在 ✓ < 33% だと、賞金の伸びは限定的 ✓ 壁を超えると一気に賞金獲得の期待が高まる
None
含意
None