Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MCMCのR-hatは分散分析である
Search
Shota Mori
June 20, 2025
Science
0
440
MCMCのR-hatは分散分析である
Shota Mori
June 20, 2025
Tweet
Share
Other Decks in Science
See All in Science
サイゼミ用因果推論
lw
1
7.5k
データベース12: 正規化(2/2) - データ従属性に基づく正規化
trycycle
PRO
0
960
How To Buy, Verified Venmo Accounts in 2025 This year
usaallshop68
3
270
地表面抽出の方法であるSMRFについて紹介
kentaitakura
1
870
Masseyのレーティングを用いたフォーミュラレースドライバーの実績評価手法の開発 / Development of a Performance Evaluation Method for Formula Race Drivers Using Massey Ratings
konakalab
0
190
データマイニング - グラフデータと経路
trycycle
PRO
1
210
データベース11: 正規化(1/2) - 望ましくない関係スキーマ
trycycle
PRO
0
940
実力評価性能を考慮した弓道高校生全国大会の大会制度設計の提案 / (konakalab presentation at MSS 2025.03)
konakalab
2
190
データベース14: B+木 & ハッシュ索引
trycycle
PRO
0
440
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
1.2k
Symfony Console Facelift
chalasr
2
460
コンピュータビジョンによるロボットの視覚と判断:宇宙空間での適応と課題
hf149
1
320
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.1k
Making Projects Easy
brettharned
117
6.4k
Building Applications with DynamoDB
mza
96
6.6k
Testing 201, or: Great Expectations
jmmastey
45
7.6k
Scaling GitHub
holman
463
140k
Context Engineering - Making Every Token Count
addyosmani
1
17
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
31
2.2k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
580
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Transcript
MCMCのR-hatは 分散分析である 森翔汰@moricup
Introduction • MCMCのR-hatを知っている人は、これが大きいと 結果の再現性が低いと言えることをご存じでしょう。 • しかし、なぜ再現性が低いと言えるか知る人は少ない印象です。 • 今夜、これを数式で解き明かします!
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが データに合わせた
右寄りの事後分布で 当てはまった
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定 マルコフ鎖ごとに結果がバラつく
分布のお気持ち データの分布は二山 どっちの山に fitしようかな 右の気分 いや、左かも やっぱり 右で
MCMCの再現性を検証したい • 各マルコフ鎖の事後分布の差が 大きいかを確認したい • 各群の差を確認したいようなもの • まるで分散分析 • 実際の統計モデルは複雑
• 可視化には限度がある • そこで R-hat による定量評価 • ベイズ推論ライブラリにも実装されている
R-hatの定義 • 𝑛: マルコフ鎖あたりのサンプル数 • 𝐵: マルコフ鎖間分散(Between) • 𝑊: マルコフ鎖内分散(Within)
𝑅 = 𝑛 − 1 𝑛 𝑊 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊 𝐵 𝑊 = マルコフ鎖間分散 マルコフ鎖内分散 ≈ 群間変動 群内変動 = 𝐹値 つまり、 𝑅が大きいことと、𝐹値が大きいことは同じ! 分散分析
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える!
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える! MCMCのR-hatは、やっぱり分散分析だ!