Upgrade to Pro — share decks privately, control downloads, hide ads and more …

関西Kaggler会_不確実性最適化ゲーム入門

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

 関西Kaggler会_不確実性最適化ゲーム入門

Avatar for Yamaguchi Takahiro

Yamaguchi Takahiro

May 22, 2026

Transcript

  1. 自己紹介 山口貴大 atma(アートマ)株式会社 取締役 / KaggleMaster 愛媛出身. 京都大学院・情報学研究科 数理最適化専攻。 データ分析や機械学習を使って、企業の課題解決やサービスづくり

    に関わってきました。 最近はデータコンペ atmCup の開催など、人が学ぶ場づくりにも取 り組んでいます! (次回も鋭意計画中🖊 / みんな参加してね) 最近🏌に夢中。ベストスコア70(HDC3) 好きな本: PRML・堕落論 twitter: @nyker_goto https://x.com/nyker_goto 2
  2. 4

  3. 理想と現実 リアルなアマチュア: 複雑怪奇な超高分散・確率論的 • 入力のブレ: 芯に当たる確率(ミート率)が毎回バラ バラで、結果 「狙ったところを中心に綺麗に飛ぶ」 のではない。 •

    右に40ヤード曲がる(スライス)かと思えば、次は 左にドカンと飛ぶ(チーピン)。外れ値(OB、空振 り、池)のオンパレード すなわち、アマチュアのゴルフは「確率論的」である。 12
  4. • 1打の価値を [打つ前] と [打った後の状況から得られる期待値] の差分(勾配)として 定義します (Stroke Gained: SG)

    • 毎回打つ価値を最も高める (SG が最も大きい) 意思決定 A を行うのが最適。 ゴルフを確率論的に理解する。 • p: どこに飛んでいくか?の確率分布 • A: プレイヤーの意思決定。意思決定により p が変わる • S: その地点 x からの期待ストローク数 今のスコア期待値 次の場所でのスコア期待値 1打分のペナルティ 13
  5. SG最適化はやばい場所 X を避ける問題と等価 • 行動Aに対しての最適化問題を変形すると… ◦ 「期待ストロークS(x) が大きいやばい所に飛ばないようp(A,x)を選ぶ」問題 • Sは過去の集計でわりとわかりやすい。では

    p(A,x) は……?? → 結構難しい 重みつきの p の最小化問題と思っても良い。 すなわち「スコア S が悪くなるような場所に行きにくいように意思決定 A を行う」 とも言える。 Aに関係ない定数項は不要 14
  6. 肝になるPの把握はとてもむずかしい • 自分のショットがどう散らばるかという分布を知るのは難しい。 ◦ PRM推しベイジアン的には… [ラウンド前の自分の状態θの分布] x [今日のこれま でのショットDに対してのθの尤度] からなるθの[今日今時点での事後分布]を用い

    て重み付けした分布を利用する必要がある (が、どちらにせよ困難) • さらに、分布は自分の実力以外のランダムネス ε でも決定する。 ◦ 風・雨・地面の状況(ライ) …常に変動する自然を観察・見極めながら調整を行う どこに飛ぶかには常にノイズ ε がつきまとう。 これには観測ノイズ (風の読みミスなど) も含む 15 自分のショットの分布を決めるパラメータθは 事前の分布に対して今日のショットDで重み付けをする必 要がある (今日は右に行く傾向あるな、など)
  7. そしてアマチュアの P はとんでもなく大きい アマチュアゴルフは「精度が低すぎて1打ごとに大爆死するリスク」を常に抱えている状態 • プロのドライバー: 幅30〜40ヤードの範囲にほぼ収まる(シャープな正規分布)。 • アマチュア: 幅100ヤード以上に分散(ギザギザで裾が広い

    / 正規分布ですらない)。 → アマチュアほど自分の意思決定 A とその時の分布 P の変化に敏感でなくてはならない。 プロの分布 きれいな分布で予想しやすい 一般アマチュア どこに飛ぶかが不正確で読みにくい 16
  8. A: これだけではなんとも言えない。 • GOTOの実力不明で打球分布Pが不明 & 周囲の状況もわからずミス時のストローク期待 値 S(x) もわからないため、答えることができない。 •

    ほとんどのアマチュア (僕も含む) は残り距離だけで判断しストロークを失う。 プレイヤーGOTO ??? ??? 左右/前後にミスしたとき どんな条件になるか不明 S(x)の計算ができない そもそもGOTOは下手で150yd 打つクラブで打つと空振りに近 いことになるかもしれない 19
  9. では情報を追加しましょう GOTOは150ydのショットはぼちぼち打てる。今日は目的より左に外し気味。 グリーン左サイドには池。右はバンカー。ピンはグリーンの左奥。奥はOB。 プレイヤーGOTO 残り距離150yd 池 (入ると+1の罰) OB (入ると+2の罰) バンカー。入ると打ちに

    くいハザード。 21 GOTOは150ydのショットはぼちぼち打てる。今日は目的より左に外し気味。 グリーン左サイドには池。右はバンカー。ピンはグリーンの左奥。奥はOB。 事前分布 p(θ) からなる p(x|θ) は それなりにまともな分布 ただ今日のデータDによると、分布p(X|θ)が 左に大きい部分へ尤度が偏っている → 目標よりも左に分布が偏っており、左側のペナルティを大きく見積もる必要がある。
  10. もっというと… これも正解とは言えない 実際にはもっと考えることがある… まじで無限にある。 • ボールのライ ◦ フェアウェイでもライは様々。例えば左足下がりでボールが上がりにくいなら高い球は難しいので手前から 転がす (転がして乗らないなら載せない選択肢を考える)

    & 飛びやすいので短い番手にする、などなど… • グリーンの大きさとピンの位置: ◦ 奥といっても 5ヤードと10ヤードでは意味が違う。グリーンがそもそも小さければグリーンを狙わない選択 もある (そもそも乗らないと諦める) • ライごとの腕前: ◦ もしバンカーが極端に苦手なのであれば、バンカーにも届かないクラブで打つほうが良いかもしれない。(バ ンカーのペナルティは人により様々) ◦ もし得意でも、バンカー難易度が異様に高い (ヘリが5mぐらいあって極端に難しい) ならいっそまっすぐ打っ て池OKとすることもあり得る。 • ここまでのスコアと周りのスコア: ◦ あと1打縮めないと予選突破できないような状況ならもっと積極的にピンを狙わなくてはならない (安全スコ アをとっても意味がない) 23
  11. なぜこの高ノイズゲームが面白いのか? • ベイズ的意思決定最適化と、結果のフィードバックループの速さ ◦ 打つ前にたくさん考えるが結果は一瞬で出てくる。 ◦ 常に P(A,x) を考え、結果を元に事後分布をベイジアン的に更新する必要性。 ◦

    試行錯誤の繰り返しはまさにデータコンペと同じ。 ◦ これを1ラウンドで数十回繰り返す == 超高負荷の分析力が必要。 • たまに出る「奇跡の1打」というガチャ ◦ アマチュアでも100回に1回、プロ並みのデータ (完璧な打球) が出力される。 ◦ この「たまの報酬(強化的報酬)」が脳に刺さる。 ◦ atmaCupの緑の画面と同じです。 ほら、なんとなくコンペとゴルフ、親和性高くないですか?? 24