Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Sports Analyst Meetup #5 LT - 目指せPGAツアー賞金王
Search
OpenJNY
November 02, 2019
Science
1.3k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Sports Analyst Meetup #5 LT - 目指せPGAツアー賞金王
PGA Tour データを GLM/GAM で簡単に分析してみました。
OpenJNY
November 02, 2019
More Decks by OpenJNY
See All by OpenJNY
Linux Networking Tools: 101
openjny
63
19k
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
openjny
10
3.3k
NSG フローログを支える技術 - NVF Advanced Flow Logging
openjny
1
950
グラフ分析ナイト - グラフデータ分析 入門編
openjny
2
1.1k
Representation Learning for Scale-free Networks: スケールフリーネットワークに対する表現学習
openjny
0
120
A Degeneracy Framework for Graph Similarity: グラフ類似度のための縮退フレームワーク
openjny
0
440
Handbook of Knowledge Representation - Chapter 2: Satisfiability Solvers
openjny
0
250
Other Decks in Science
See All in Science
AI(人工知能)の過去・現在・未来 ~AIは人類を越えるのか~
tagtag
PRO
0
110
Endel Tulvingとエピソード記憶
rmaruy
0
140
Kritische evaluatie van GenAI-output voor literatuuronderzoek
voginip
0
180
防災デジタル分野での官民共創の取り組み (1)防災DX官民共創をどう進めるか
ditccsugii
0
670
Rashomon at the Sound: Reconstructing all possible paleoearthquake histories in the Puget Lowland through topological search
cossatot
0
1.1k
SHINOMIYA Nariyoshi
genomethica
0
150
1. CPC理論の展開と集合的知能モデル(JSAI2026 KS-27 集合的予測符号化と新たな知性の時代)
hayashiyus884
1
210
Van Dare naar Durf
voginip
0
240
大黒市で発生した大規模インシデント の ポストモーテムから読み解く、 記憶媒体消去の大切さ
shucho0103
0
200
JSAI2026企画セッションKS-14 インタビュー集『⼈⼯知能と哲学と四つの問い』が提起する⼈⼯知能のこれからの課題 趣旨説明 / JSAI2026 Special Session: A Collection of Interviews, “Artificial Intelligence, Philosophy, and Four Questions”
ykiyota
0
300
機械学習 - DBSCAN
trycycle
PRO
0
1.9k
(2025) Balade en cyclotomie
mansuy
0
630
Featured
See All Featured
The Limits of Empathy - UXLibs8
cassininazir
1
370
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
260
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.9k
Design in an AI World
tapps
1
250
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
1
1.8k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
3
1.1k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Claude Code のすすめ
schroneko
67
230k
GraphQLとの向き合い方2022年版
quramy
50
15k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Transcript
目指せ PGA ツアー賞金王
$ about-me . ├── 山口順也 (Junya Yamaguchi) │ ├── @OpenJNY
│ ├── 某パブリッククラウドで Support Eng. やってます (新卒 1 年目) │ └── Networking の勉強中 (LB, WAF, etc) └── 東京工業大学・大学院で人工知能基礎と機械学習を勉強してました ├── 理論よりの本 (e.g. PRML, MLaPP) が好き ├── 卒論は「SAT ソルバ × GPGPU」 ├── 修論は「SAT ソルバ × グラフ埋め込み」 └── Kaggle はやってません グラフ埋め込みは、めちゃくちゃおもしろい&今ホットなト ピックなので、興味あるかたいれば是非説明したい内容
None
None
LT テーマ: PGA ツアーの stats を GLM/GAM で分析してみる - https://www.kaggle.com/bradklassen/pga-tour-20102018-data
- LT の目的: - Python の GAM ライブラリ pyGAM を知る - PGA ツアーで賞金王になるための知見をゴル活に活かす - ノートブックは以下の URL で公開しています - https://www.kaggle.com/juyamagu/pga-tour-analysis-by-gam
背景: モデルの入力次元と解釈性 - 3 以上の次元を持つ入力を扱う関数は、人 間が視覚的に解釈できない - なので解釈可能にするには、入力を 1 次
元ないしは 2 次元に抑える必要がある - 複数の入力を一気に扱う機械学習モデ ル (e.g. DNN) などは解釈できない… N/A 2 次元以下の入力の関数を 組み合わせたモデルなら視覚的に解釈可能
GLM と GAM • 一般化線形モデル (Generalized Linear Model; GLM) •
一般化加法モデル (Generalized Linear Model; GLM) GLM の詳細は緑本や MLaPP 9章、GAM の詳細はカステラ本 9章を参照くださいm(_ _)m Hastie, T. J.; Tibshirani, R. J. (1990) Nelder, J.; Wedderburn, R. (1972)
pyGAM https://pygam.readthedocs.io/en/latest/
$ pip install pygam
None
データ概観: スキーマ カラム名 説明 PlayerName 名前 Season 年度 Money 年間獲得賞金
($) DrivingDistance 平均ドライバー飛距離 (yard) DrivingAccuracy フェアウェイ キープ率 DistanceEfficiency 飛距離/スピードの平均 NonDrivingDistance 平地での平均飛距離 (yard) カラム名 説明 BallSpeed ボールの平均スピード ScramblingSand バンカーからのスクランブル率 ScramblingFringe フリンジからのスクランブル率 ScramblingRough ラフからのスクランブル率 ThreePutRate スリーパットを叩いたホール率 BirdieConversion バーディ以上のホール率
データ概観: 相関係数 賞金と正の相関が強いもの - ドライバーの距離 - 飛距離の効率性 (スピン量) - ボールスピード
- ラフからのリカバリの上手さ - バーディよりよい成績でホールを終える 率 賞金と負の相関が認められるもの - ドライバー以外のショット飛距離 - 3 パットするホールの割合
PyGAM: GLM による Money 予測
None
PyGAM: GAM による Money の予測 l (Linear) を s (Spline)
に置換するだけ
None
GAM の表現力の豊かさ GLM GAM 一般化加法モデル 一般化線形モデル ✓ BirdieConversion (バーディより良い成績のホー ル率)
が大きいほど、賞金が稼げる傾向にある ✓ BirdieConversion (バーディより良い成績のホー ル率) が大きいほど、賞金が稼げる傾向にある ✓ ただし33 パーセント付近に「大きな壁」の存在 ✓ < 33% だと、賞金の伸びは限定的 ✓ 壁を超えると一気に賞金獲得の期待が高まる
None
含意
None