Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
関西Kaggler会_不確実性最適化ゲーム入門
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yamaguchi Takahiro
May 22, 2026
750
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
関西Kaggler会_不確実性最適化ゲーム入門
Yamaguchi Takahiro
May 22, 2026
More Decks by Yamaguchi Takahiro
See All by Yamaguchi Takahiro
コンペを気楽に開催しよーぜ!@関西Kaggler会
nyk510
0
1.4k
Django のセキュリティリリースを見る
nyk510
0
130
3分でMLアプリを作る 〜推論コードにちょっとのStreamlitを添えて〜
nyk510
1
1.2k
硬派で真面目なグラフを描く
nyk510
0
570
CORSをちゃんと理解する atmaバックエンド勉強会#4
nyk510
0
460
pythonで気軽にパッケージを作るのは良いという話。
nyk510
14
9.9k
RestAPIのページネーション atma バックエンド勉強会 #3
nyk510
1
1.1k
AWS CPU Credit を完全に理解する
nyk510
0
510
atmaCup#8 Opening
nyk510
0
320
Featured
See All Featured
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
180
Build your cross-platform service in a week with App Engine
jlugia
234
18k
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
270
Side Projects
sachag
455
43k
The SEO Collaboration Effect
kristinabergwall1
1
490
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
610
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
Technical Leadership for Architectural Decision Making
baasie
3
420
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
56k
Transcript
不確実性最適化ゲーム入門 2026-05-22 関西Kaggler会 交流会 in Osaka 2026 第一部 @nyk510 1
自己紹介 山口貴大 atma(アートマ)株式会社 取締役 / KaggleMaster 愛媛出身. 京都大学院・情報学研究科 数理最適化専攻。 データ分析や機械学習を使って、企業の課題解決やサービスづくり
に関わってきました。 最近はデータコンペ atmCup の開催など、人が学ぶ場づくりにも取 り組んでいます! (次回も鋭意計画中🖊 / みんな参加してね) 最近🏌に夢中。ベストスコア70(HDC3) 好きな本: PRML・堕落論 twitter: @nyker_goto https://x.com/nyker_goto 2
第一部は緩いとのことなので… 今日は僕の大好きな 「不確実性最適化ゲーム」について お話をしに来ました。 3
4
そう、ゴルフです!! 5
Q: ゴルフにどういう印象を持っていますか?? 6
接待・お金かかる・おじさんのスポーツ Kagglerに何の関係があるんだ? 7
いえいえ…実は ゴルフはKaggler的思考と 驚くほど相性が良いスポーツです。 8
その本質は、ずばり 不確実性と向き合いつつ 状況を最適化するゲームです 9
本題: STATISTICAL GAME OPTIMIZATION ゴルフという名の、 不確実性最適化ゲーム Kaggler のためのデータサイエンス視点ゴルフ⼊⾨ 10
理想と現実 「みんゴル (ゴルフゲーム)的世界観」: 決定論的・極小ノイズ • ミスはあるものの限定的であり、ほぼ決定論的 (狙いどころには殆ど飛ぶ) 11
理想と現実 リアルなアマチュア: 複雑怪奇な超高分散・確率論的 • 入力のブレ: 芯に当たる確率(ミート率)が毎回バラ バラで、結果 「狙ったところを中心に綺麗に飛ぶ」 のではない。 •
右に40ヤード曲がる(スライス)かと思えば、次は 左にドカンと飛ぶ(チーピン)。外れ値(OB、空振 り、池)のオンパレード すなわち、アマチュアのゴルフは「確率論的」である。 12
• 1打の価値を [打つ前] と [打った後の状況から得られる期待値] の差分(勾配)として 定義します (Stroke Gained: SG)
• 毎回打つ価値を最も高める (SG が最も大きい) 意思決定 A を行うのが最適。 ゴルフを確率論的に理解する。 • p: どこに飛んでいくか?の確率分布 • A: プレイヤーの意思決定。意思決定により p が変わる • S: その地点 x からの期待ストローク数 今のスコア期待値 次の場所でのスコア期待値 1打分のペナルティ 13
SG最適化はやばい場所 X を避ける問題と等価 • 行動Aに対しての最適化問題を変形すると… ◦ 「期待ストロークS(x) が大きいやばい所に飛ばないようp(A,x)を選ぶ」問題 • Sは過去の集計でわりとわかりやすい。では
p(A,x) は……?? → 結構難しい 重みつきの p の最小化問題と思っても良い。 すなわち「スコア S が悪くなるような場所に行きにくいように意思決定 A を行う」 とも言える。 Aに関係ない定数項は不要 14
肝になるPの把握はとてもむずかしい • 自分のショットがどう散らばるかという分布を知るのは難しい。 ◦ PRM推しベイジアン的には… [ラウンド前の自分の状態θの分布] x [今日のこれま でのショットDに対してのθの尤度] からなるθの[今日今時点での事後分布]を用い
て重み付けした分布を利用する必要がある (が、どちらにせよ困難) • さらに、分布は自分の実力以外のランダムネス ε でも決定する。 ◦ 風・雨・地面の状況(ライ) …常に変動する自然を観察・見極めながら調整を行う どこに飛ぶかには常にノイズ ε がつきまとう。 これには観測ノイズ (風の読みミスなど) も含む 15 自分のショットの分布を決めるパラメータθは 事前の分布に対して今日のショットDで重み付けをする必 要がある (今日は右に行く傾向あるな、など)
そしてアマチュアの P はとんでもなく大きい アマチュアゴルフは「精度が低すぎて1打ごとに大爆死するリスク」を常に抱えている状態 • プロのドライバー: 幅30〜40ヤードの範囲にほぼ収まる(シャープな正規分布)。 • アマチュア: 幅100ヤード以上に分散(ギザギザで裾が広い
/ 正規分布ですらない)。 → アマチュアほど自分の意思決定 A とその時の分布 P の変化に敏感でなくてはならない。 プロの分布 きれいな分布で予想しやすい 一般アマチュア どこに飛ぶかが不正確で読みにくい 16
数式ばっかりだとよくわからない… 具体的にはどんな感じか体感しましょう!! 17
Q: 残り150ydのグリーンをどのように狙う? GOTOさんは首尾よくピンまで残り150ydのところに来ました。 どんなショットをするのが最適?? プレイヤーGOTO 残り距離150yd 18
A: これだけではなんとも言えない。 • GOTOの実力不明で打球分布Pが不明 & 周囲の状況もわからずミス時のストローク期待 値 S(x) もわからないため、答えることができない。 •
ほとんどのアマチュア (僕も含む) は残り距離だけで判断しストロークを失う。 プレイヤーGOTO ??? ??? 左右/前後にミスしたとき どんな条件になるか不明 S(x)の計算ができない そもそもGOTOは下手で150yd 打つクラブで打つと空振りに近 いことになるかもしれない 19
では情報を追加しましょう GOTOは150ydのショットはぼちぼち打てる。今日は目的より左に外し気味。 グリーン左サイドには池。右はバンカー。ピンはグリーンの左奥。奥はOB。 プレイヤーGOTO 残り距離150yd 池 (入ると+1の罰) OB (入ると+2の罰) バンカー。入ると打ちに
くいハザード。 20
では情報を追加しましょう GOTOは150ydのショットはぼちぼち打てる。今日は目的より左に外し気味。 グリーン左サイドには池。右はバンカー。ピンはグリーンの左奥。奥はOB。 プレイヤーGOTO 残り距離150yd 池 (入ると+1の罰) OB (入ると+2の罰) バンカー。入ると打ちに
くいハザード。 21 GOTOは150ydのショットはぼちぼち打てる。今日は目的より左に外し気味。 グリーン左サイドには池。右はバンカー。ピンはグリーンの左奥。奥はOB。 事前分布 p(θ) からなる p(x|θ) は それなりにまともな分布 ただ今日のデータDによると、分布p(X|θ)が 左に大きい部分へ尤度が偏っている → 目標よりも左に分布が偏っており、左側のペナルティを大きく見積もる必要がある。
A: 150yd届かないクラブで右手前に打つ 最も入るとまずいのはOB (問答無用で+2)。なのでピン奥に外さないクラブを選択。 次に入ってほしくないのは池。左に行く傾向があるのでピンを狙わず右サイドに打つ。 プレイヤーGOTO イメージ的には 140ydちょっとぐらいの狙い バンカーは許容 /
池・OBを避ける 22
もっというと… これも正解とは言えない 実際にはもっと考えることがある… まじで無限にある。 • ボールのライ ◦ フェアウェイでもライは様々。例えば左足下がりでボールが上がりにくいなら高い球は難しいので手前から 転がす (転がして乗らないなら載せない選択肢を考える)
& 飛びやすいので短い番手にする、などなど… • グリーンの大きさとピンの位置: ◦ 奥といっても 5ヤードと10ヤードでは意味が違う。グリーンがそもそも小さければグリーンを狙わない選択 もある (そもそも乗らないと諦める) • ライごとの腕前: ◦ もしバンカーが極端に苦手なのであれば、バンカーにも届かないクラブで打つほうが良いかもしれない。(バ ンカーのペナルティは人により様々) ◦ もし得意でも、バンカー難易度が異様に高い (ヘリが5mぐらいあって極端に難しい) ならいっそまっすぐ打っ て池OKとすることもあり得る。 • ここまでのスコアと周りのスコア: ◦ あと1打縮めないと予選突破できないような状況ならもっと積極的にピンを狙わなくてはならない (安全スコ アをとっても意味がない) 23
なぜこの高ノイズゲームが面白いのか? • ベイズ的意思決定最適化と、結果のフィードバックループの速さ ◦ 打つ前にたくさん考えるが結果は一瞬で出てくる。 ◦ 常に P(A,x) を考え、結果を元に事後分布をベイジアン的に更新する必要性。 ◦
試行錯誤の繰り返しはまさにデータコンペと同じ。 ◦ これを1ラウンドで数十回繰り返す == 超高負荷の分析力が必要。 • たまに出る「奇跡の1打」というガチャ ◦ アマチュアでも100回に1回、プロ並みのデータ (完璧な打球) が出力される。 ◦ この「たまの報酬(強化的報酬)」が脳に刺さる。 ◦ atmaCupの緑の画面と同じです。 ほら、なんとなくコンペとゴルフ、親和性高くないですか?? 24
ここまでのまとめ • ゴルフとは確率論的ゲームである。 • ストローク期待値の最適化を解くためには、己の実力を見定めボールが飛ぶ分布 P を 知る必要がある。 • それすなわち「己を知ること」であり、無限に頭を使う。
• ゴルフはほとんどデータコンペである。 25
興味が湧いた方は是非 nyk510まで!! 一緒に練習・ラウンドしましょう🏌 26