関西Kaggler会_不確実性最適化ゲーム入門

不確実性最適化ゲーム入門 2026-05-22 関西Kaggler会交流会 in Osaka 2026 第一部 @nyk510 1

自己紹介山口貴大 atma(アートマ)株式会社取締役 / KaggleMaster 愛媛出身. 京都大学院・情報学研究科数理最適化専攻。データ分析や機械学習を使って、企業の課題解決やサービスづくり
に関わってきました。最近はデータコンペ atmCup の開催など、人が学ぶ場づくりにも取り組んでいます! (次回も鋭意計画中🖊 / みんな参加してね) 最近🏌に夢中。ベストスコア70(HDC3) 好きな本: PRML・堕落論 twitter: @nyker_goto https://x.com/nyker_goto 2

第一部は緩いとのことなので… 今日は僕の大好きな「不確実性最適化ゲーム」についてお話をしに来ました。 3

そう、ゴルフです!! 5

Q: ゴルフにどういう印象を持っていますか?? 6

接待・お金かかる・おじさんのスポーツ Kagglerに何の関係があるんだ? 7

いえいえ…実はゴルフはKaggler的思考と驚くほど相性が良いスポーツです。 8

その本質は、ずばり不確実性と向き合いつつ状況を最適化するゲームです 9

本題: STATISTICAL GAME OPTIMIZATION ゴルフという名の、不確実性最適化ゲーム Kaggler のためのデータサイエンス視点ゴルフ⼊⾨ 10

理想と現実「みんゴル (ゴルフゲーム)的世界観」: 決定論的・極小ノイズ • ミスはあるものの限定的であり、ほぼ決定論的 (狙いどころには殆ど飛ぶ) 11

理想と現実リアルなアマチュア: 複雑怪奇な超高分散・確率論的 • 入力のブレ: 芯に当たる確率（ミート率）が毎回バラバラで、結果「狙ったところを中心に綺麗に飛ぶ」のではない。 •
右に40ヤード曲がる（スライス）かと思えば、次は左にドカンと飛ぶ（チーピン）。外れ値（OB、空振り、池）のオンパレードすなわち、アマチュアのゴルフは「確率論的」である。 12

• 1打の価値を [打つ前] と [打った後の状況から得られる期待値] の差分（勾配）として定義します (Stroke Gained: SG)
• 毎回打つ価値を最も高める (SG が最も大きい) 意思決定 A を行うのが最適。ゴルフを確率論的に理解する。 • p: どこに飛んでいくか?の確率分布 • A: プレイヤーの意思決定。意思決定により p が変わる • S: その地点 x からの期待ストローク数今のスコア期待値次の場所でのスコア期待値 1打分のペナルティ 13

SG最適化はやばい場所 X を避ける問題と等価 • 行動Aに対しての最適化問題を変形すると… ◦ 「期待ストロークS(x) が大きいやばい所に飛ばないようp(A,x)を選ぶ」問題 • Sは過去の集計でわりとわかりやすい。では
p(A,x) は……?? → 結構難しい重みつきの p の最小化問題と思っても良い。すなわち「スコア S が悪くなるような場所に行きにくいように意思決定 A を行う」とも言える。 Aに関係ない定数項は不要 14

肝になるPの把握はとてもむずかしい • 自分のショットがどう散らばるかという分布を知るのは難しい。 ◦ PRM推しベイジアン的には… [ラウンド前の自分の状態θの分布] x [今日のこれまでのショットDに対してのθの尤度] からなるθの[今日今時点での事後分布]を用い
て重み付けした分布を利用する必要がある (が、どちらにせよ困難) • さらに、分布は自分の実力以外のランダムネス ε でも決定する。 ◦ 風・雨・地面の状況(ライ) …常に変動する自然を観察・見極めながら調整を行うどこに飛ぶかには常にノイズ ε がつきまとう。これには観測ノイズ (風の読みミスなど) も含む 15 自分のショットの分布を決めるパラメータθは事前の分布に対して今日のショットDで重み付けをする必要がある (今日は右に行く傾向あるな、など)

そしてアマチュアの P はとんでもなく大きいアマチュアゴルフは「精度が低すぎて1打ごとに大爆死するリスク」を常に抱えている状態 • プロのドライバー: 幅30〜40ヤードの範囲にほぼ収まる（シャープな正規分布）。 • アマチュア: 幅100ヤード以上に分散（ギザギザで裾が広い
/ 正規分布ですらない）。 → アマチュアほど自分の意思決定 A とその時の分布 P の変化に敏感でなくてはならない。プロの分布きれいな分布で予想しやすい一般アマチュアどこに飛ぶかが不正確で読みにくい 16

数式ばっかりだとよくわからない… 具体的にはどんな感じか体感しましょう!! 17

Q: 残り150ydのグリーンをどのように狙う? GOTOさんは首尾よくピンまで残り150ydのところに来ました。どんなショットをするのが最適?? プレイヤーGOTO 残り距離150yd 18

A: これだけではなんとも言えない。 • GOTOの実力不明で打球分布Pが不明 & 周囲の状況もわからずミス時のストローク期待値 S(x) もわからないため、答えることができない。 •
ほとんどのアマチュア (僕も含む) は残り距離だけで判断しストロークを失う。プレイヤーGOTO ??? ??? 左右/前後にミスしたときどんな条件になるか不明 S(x)の計算ができないそもそもGOTOは下手で150yd 打つクラブで打つと空振りに近いことになるかもしれない 19

では情報を追加しましょう GOTOは150ydのショットはぼちぼち打てる。今日は目的より左に外し気味。グリーン左サイドには池。右はバンカー。ピンはグリーンの左奥。奥はOB。プレイヤーGOTO 残り距離150yd 池 (入ると+1の罰) OB (入ると+2の罰) バンカー。入ると打ちに
くいハザード。 20

では情報を追加しましょう GOTOは150ydのショットはぼちぼち打てる。今日は目的より左に外し気味。グリーン左サイドには池。右はバンカー。ピンはグリーンの左奥。奥はOB。プレイヤーGOTO 残り距離150yd 池 (入ると+1の罰) OB (入ると+2の罰) バンカー。入ると打ちに
くいハザード。 21 GOTOは150ydのショットはぼちぼち打てる。今日は目的より左に外し気味。グリーン左サイドには池。右はバンカー。ピンはグリーンの左奥。奥はOB。事前分布 p(θ) からなる p(x|θ) はそれなりにまともな分布ただ今日のデータDによると、分布p(X|θ)が左に大きい部分へ尤度が偏っている → 目標よりも左に分布が偏っており、左側のペナルティを大きく見積もる必要がある。

A: 150yd届かないクラブで右手前に打つ最も入るとまずいのはOB (問答無用で+2)。なのでピン奥に外さないクラブを選択。次に入ってほしくないのは池。左に行く傾向があるのでピンを狙わず右サイドに打つ。プレイヤーGOTO イメージ的には 140ydちょっとぐらいの狙いバンカーは許容 /
池・OBを避ける 22

もっというと… これも正解とは言えない実際にはもっと考えることがある… まじで無限にある。 • ボールのライ ◦ フェアウェイでもライは様々。例えば左足下がりでボールが上がりにくいなら高い球は難しいので手前から転がす (転がして乗らないなら載せない選択肢を考える)
& 飛びやすいので短い番手にする、などなど… • グリーンの大きさとピンの位置: ◦ 奥といっても 5ヤードと10ヤードでは意味が違う。グリーンがそもそも小さければグリーンを狙わない選択もある (そもそも乗らないと諦める) • ライごとの腕前: ◦ もしバンカーが極端に苦手なのであれば、バンカーにも届かないクラブで打つほうが良いかもしれない。(バンカーのペナルティは人により様々) ◦ もし得意でも、バンカー難易度が異様に高い (ヘリが5mぐらいあって極端に難しい) ならいっそまっすぐ打って池OKとすることもあり得る。 • ここまでのスコアと周りのスコア: ◦ あと1打縮めないと予選突破できないような状況ならもっと積極的にピンを狙わなくてはならない (安全スコアをとっても意味がない) 23

なぜこの高ノイズゲームが面白いのか？ • ベイズ的意思決定最適化と、結果のフィードバックループの速さ ◦ 打つ前にたくさん考えるが結果は一瞬で出てくる。 ◦ 常に P(A,x) を考え、結果を元に事後分布をベイジアン的に更新する必要性。 ◦
試行錯誤の繰り返しはまさにデータコンペと同じ。 ◦ これを1ラウンドで数十回繰り返す == 超高負荷の分析力が必要。 • たまに出る「奇跡の1打」というガチャ ◦ アマチュアでも100回に1回、プロ並みのデータ (完璧な打球) が出力される。 ◦ この「たまの報酬（強化的報酬）」が脳に刺さる。 ◦ atmaCupの緑の画面と同じです。ほら、なんとなくコンペとゴルフ、親和性高くないですか?? 24

ここまでのまとめ • ゴルフとは確率論的ゲームである。 • ストローク期待値の最適化を解くためには、己の実力を見定めボールが飛ぶ分布 P を知る必要がある。 • それすなわち「己を知ること」であり、無限に頭を使う。
• ゴルフはほとんどデータコンペである。 25

興味が湧いた方は是非 nyk510まで!! 一緒に練習・ラウンドしましょう🏌 26

関西Kaggler会_不確実性最適化ゲーム入門

関西Kaggler会_不確実性最適化ゲーム入門

Yamaguchi Takahiro

More Decks by Yamaguchi Takahiro

Featured

Transcript

不確実性最適化ゲーム入門 2026-05-22 関西Kaggler会交流会 in Osaka 2026 第一部 @nyk510 1

自己紹介山口貴大 atma(アートマ)株式会社取締役 / KaggleMaster 愛媛出身. 京都大学院・情報学研究科数理最適化専攻。データ分析や機械学習を使って、企業の課題解決やサービスづくり

第一部は緩いとのことなので… 今日は僕の大好きな「不確実性最適化ゲーム」についてお話をしに来ました。 3

4

そう、ゴルフです!! 5

Q: ゴルフにどういう印象を持っていますか?? 6

接待・お金かかる・おじさんのスポーツ Kagglerに何の関係があるんだ? 7

いえいえ…実はゴルフはKaggler的思考と驚くほど相性が良いスポーツです。 8

その本質は、ずばり不確実性と向き合いつつ状況を最適化するゲームです 9

本題: STATISTICAL GAME OPTIMIZATION ゴルフという名の、不確実性最適化ゲーム Kaggler のためのデータサイエンス視点ゴルフ⼊⾨ 10

理想と現実「みんゴル (ゴルフゲーム)的世界観」: 決定論的・極小ノイズ • ミスはあるものの限定的であり、ほぼ決定論的 (狙いどころには殆ど飛ぶ) 11

理想と現実リアルなアマチュア: 複雑怪奇な超高分散・確率論的 • 入力のブレ: 芯に当たる確率（ミート率）が毎回バラバラで、結果「狙ったところを中心に綺麗に飛ぶ」のではない。 •

• 1打の価値を [打つ前] と [打った後の状況から得られる期待値] の差分（勾配）として定義します (Stroke Gained: SG)

SG最適化はやばい場所 X を避ける問題と等価 • 行動Aに対しての最適化問題を変形すると… ◦ 「期待ストロークS(x) が大きいやばい所に飛ばないようp(A,x)を選ぶ」問題 • Sは過去の集計でわりとわかりやすい。では

数式ばっかりだとよくわからない… 具体的にはどんな感じか体感しましょう!! 17

Q: 残り150ydのグリーンをどのように狙う? GOTOさんは首尾よくピンまで残り150ydのところに来ました。どんなショットをするのが最適?? プレイヤーGOTO 残り距離150yd 18

A: これだけではなんとも言えない。 • GOTOの実力不明で打球分布Pが不明 & 周囲の状況もわからずミス時のストローク期待値 S(x) もわからないため、答えることができない。 •

興味が湧いた方は是非 nyk510まで!! 一緒に練習・ラウンドしましょう🏌 26