Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Lordのパラドックス
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Masafumi Abeta
August 27, 2021
Science
730
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Lordのパラドックス
Pythonデータ分析勉強会#29 の発表資料です。
https://pythondata.connpass.com/event/221652/
Masafumi Abeta
August 27, 2021
More Decks by Masafumi Abeta
See All by Masafumi Abeta
Pythonのパッケージマネージャー「uv」
abeta
1
440
GPTモデルでキャラクター設定する際の課題
abeta
0
380
GPTをLINEで使えるようにして布教した
abeta
0
220
【Nishika】プリント基板の電子部品検出
abeta
0
360
初心者向けChatGPT入門
abeta
0
280
GPT Short Talk
abeta
0
170
拡散モデルについて少しだけ
abeta
0
88
動的計画モデル
abeta
0
200
物体追跡
abeta
0
350
Other Decks in Science
See All in Science
なぜエネルギーは保存する? 〜自由落下でわかる“対称性”とネーターの定理〜
syotasasaki593876
0
190
AI bij literatuuronderzoek in de wetenschap
voginip
0
190
J-STAGE全文XML登載必須化について
xspa2012
0
850
Bリーグのショットデータを活用した得点期待値モデルの構築 / Construction of expected points model using shot data of B.LEAGUE
konakalab
0
150
生成AIと司法書士の未来.pdf
tagtag
PRO
0
130
防災デジタル分野での官民共創の取り組み (1)防災DX官民共創をどう進めるか
ditccsugii
0
670
機械学習 - DBSCAN
trycycle
PRO
0
1.9k
機械学習 - SVM
trycycle
PRO
2
1.1k
(CVPR2026) Back to Basics: Let Denoising Generative Models Denoise
shumpei777
0
170
YouTubeにおける撤回論文の参照実態 / metascience-meetup2026
corgies
3
300
俺たちは本当に分かり合えるのか? ~ PdMとスクラムチームの “ずれ” を科学する
bonotake
2
2.4k
データベース03: 関係データモデル
trycycle
PRO
1
560
Featured
See All Featured
HDC tutorial
michielstock
2
720
The SEO Collaboration Effect
kristinabergwall1
1
490
Unsuck your backbone
ammeep
672
58k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Optimising Largest Contentful Paint
csswizardry
37
3.7k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
450
The Limits of Empathy - UXLibs8
cassininazir
1
370
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
380
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
310
Bash Introduction
62gerente
615
220k
Transcript
XX University Lordのパラドクス 2021.08.26 Abeta
2 どちらの統計家が正しい? ある全寮制の学校にて、学⽣たちは学年の初めにミールプランAとミールプランBを選ぶ。そして年初と年末 に体重を計測した。ミールプランが体重に与える影響について調べたい。計測値はグラフのようになった。 データ分析を⼆⼈の統計家に依頼したところ次の返事が返ってきた。 統計家1:𝑊! − 𝑊" を集計するとゼロになるので、ミールプランA or
Bで体重への影響はない。 統計家2:年初の体重が𝑤# の学⽣はミールプランBの⽅が体重が増加しており、体重への影響がある。 (⾮現実的だが思考問題のために、𝑤# の値に依存しないと仮定する) 𝑊" 𝑊! B A 𝑊! = 𝑊" 𝑤#
3 数式で考えよう 統計家1が計算しているもの。 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤#
, 𝑋 = 𝑎 − 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑏 𝐸 𝑊! − 𝑊" = 0 統計家2が計算しているもの。 ∵グラフから
4 因果モデル 𝑌 = 𝑊! − 𝑊" 、 𝑋をミールプランを表す確率変数と定義して、因果モデルを考える。 ⼊寮後にミールプランを選ぶので、時系列を考えると初期体重がミールプランの選択に影響を及ぼす可能性が
ある。 𝑊, 𝑊- 𝑋 𝑌 +1 −1
5 統計家1を深堀りしてみる ミールプランの違いを考慮していないので、ミールプランごとに計算してみよう。 𝐸 𝑊! − 𝑊" do 𝑋 =
𝑎 − 𝐸[𝑊! − 𝑊" |do(𝑋 = 𝑏)] グラフから同時分布を求め、条件付き分布を求める。 𝑃 𝑌 do 𝑋 = 𝑥 = 𝑃! 𝑌 𝑋 = 𝑥 = ( ","$ 𝑃!(𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤′|𝑋 = 𝑥) = ( ","$ 𝑃! 𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤$ 𝑃! 𝑊& = 𝑤$ 𝑃!(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) = ( ","$ 𝑃 𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤$ 𝑃 𝑊& = 𝑤$ 𝑃(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) ⇒ 𝐸 𝑌 do 𝑋 = 𝑥 = ( ","$ 𝐸 𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤$ 𝑃 𝑊& = 𝑤$ 𝑃(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) = ( ","$ (𝑤 − 𝑤′)𝑃 𝑊& = 𝑤$ 𝑃(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) !! !" ! = # " +1 −1 !! !" # " +1 −1 do
6 ミールプランの効果 𝐸 𝑌 do 𝑋 = 𝑎 = (
!,!# (𝑤 − 𝑤′)𝑃 𝑊$ = 𝑤# 𝑃(𝑊% = 𝑤|𝑊$ = 𝑤#, 𝑋 = 𝑎) = ( !,!# 𝑤𝑃(𝑊% = 𝑤|𝑊$ = 𝑤#, 𝑋 = 𝑎) 𝑃 𝑊$ = 𝑤# − ( !! 𝑤#𝑃 𝑊$ = 𝑤# = ( !# 𝐸(𝑊% |𝑊$ = 𝑤#, 𝑋 = 𝑎) 𝑃 𝑊$ = 𝑤# − 𝐸 𝑊$ = ( !# (𝜇% & − 𝜌& 𝜎% & 𝜎$ & 𝑤# − 𝜇$ & )𝑃 𝑊$ = 𝑤# − 𝜇$ = 𝜇% & − 𝜌& 𝜎% & 𝜎$ & 𝜇$ − 𝜇$ & − 𝜇$ = (𝜇% &−𝜇$ ) 1 + 𝜌& 𝜎% & 𝜎$ & < 0 𝑃 𝑌 do 𝑋 = 𝑎 − 𝑃 𝑌 do 𝑋 = 𝑏 = (𝜇% &−𝜇$ ) 1 + 𝜌& 𝜎% & 𝜎$ & − (𝜇% '−𝜇$ ) 1 + 𝜌' 𝜎% ' 𝜎$ ' (< 0) = 𝜇% & 1 + 𝜌& 𝜎% & 𝜎$ & − 𝜇% ' 1 + 𝜌' 𝜎% ' 𝜎$ ' − 𝜇$ (𝜌& 𝜎% & 𝜎$ & − 𝜌' 𝜎% ' 𝜎$ ' ) = 1 + 𝜌 𝜇% & − 𝜇% ' ∵これ以上計算できないのでガウス分布を仮定する ∵分散と相関が同じだと仮定しちゃおう! ∵グラフより !! !" B A !" = !! ## 𝑃 𝑌 do 𝑋 = 𝑏 = (𝜇% '−𝜇$ ) 1 + 𝜌' 𝜎% ' 𝜎$ ' > 0
7 統計家2を深堀りしてみよう 統計家2が計算したかったであろうもの。 𝐸 𝑊! − 𝑊" do 𝑋 =
𝑎, 𝑊" = 𝑤# − 𝐸[𝑊! − 𝑊" |do(𝑋 = 𝑏, 𝑊" = 𝑤# )] 𝑊$ = 𝑤( 𝑊- 𝑋 = 𝑥 𝑌 +1 −1 これで計算できるのは、ミールプランが𝑌に与える「制御された直接効果」である。 𝑊, 𝑊- 𝑋 𝑌 +1 −1 do
8 制御された直接効果を計算しよう (1/2) !! = #" !! $ = %
" +1 −1 !% !! # " +1 −1 do 𝑃 𝑌 do 𝑋 = 𝑥, 𝑊" = 𝑤# = 𝑃$ 𝑌 𝑋 = 𝑥, 𝑊" = 𝑤# 定義から、 𝑃$ 𝑌, 𝑋, 𝑊" , 𝑊! = 𝑃$ 𝑌 𝑊" , 𝑊! 𝑃$ 𝑊" 𝑃$ 𝑊! 𝑊" , 𝑋 𝑃$ 𝑋 ⇒ 𝑃$ 𝑌, 𝑋, 𝑊" = : % 𝑃$ 𝑌 𝑊" , 𝑊! = 𝑤 𝑃$ 𝑊" 𝑃$ 𝑊! = 𝑤 𝑊" , 𝑋 𝑃$ 𝑋 ⇒ 𝑃$ 𝑌|𝑋, 𝑊" = : % 𝑃$ 𝑌 𝑊" , 𝑊! = 𝑤 𝑃$ 𝑊" 𝑃$ 𝑊! = 𝑤 𝑊" , 𝑋 𝑃$ 𝑋 /𝑃$ (𝑋, 𝑊" ) = : % 𝑃$ 𝑌 𝑊" , 𝑊! = 𝑤 𝑃$ 𝑊! = 𝑤 𝑊" , 𝑋 = : % 𝑃 𝑌 𝑊" , 𝑊! = 𝑤 𝑃 𝑊! = 𝑤 𝑊" , 𝑋 グラフから同時分布を求め、条件付き分布を求める。
9 制御された直接効果を計算しよう (2/2) 𝐸 𝑌 do 𝑋 = 𝑎, 𝑊&
= 𝑤' = ( " 𝐸 𝑌 𝑊& = 𝑤' , 𝑊% = 𝑤 𝑃 𝑊% = 𝑤 𝑊& = 𝑤' , 𝑋 = 𝑎 = ( " (𝑤 − 𝑤')𝑃 𝑊% = 𝑤 𝑊& = 𝑤', 𝑋 = 𝑎 = ( " 𝑤𝑃 𝑊% = 𝑤 𝑊& = 𝑤' , 𝑋 = 𝑎 − 𝑤' = 𝐸 𝑊% 𝑊& = 𝑤' , 𝑋 = 𝑎 − 𝑤' = 𝜇% ( − 𝜌( 𝜎% ( 𝜎& ( 𝑤' − 𝜇& ( − 𝑤' 𝐸 𝑌 do 𝑋 = 𝑎, 𝑊& = 𝑤' − 𝐸 𝑌 do 𝑋 = 𝑏, 𝑊& = 𝑤' = 𝜇% ( − 𝜇% ) − 𝜌( 𝜎% ( 𝜎& ( 𝑤' − 𝜇& ( + 𝜌) 𝜎% ) 𝜎& ) 𝑤' − 𝜇& ) (< 0) = 𝜇% ( 1 + 𝜌( 𝜎% ( 𝜎& ( − 𝜇% ) 1 + 𝜌) 𝜎% ) 𝜎& ) − 𝑤'(𝜌( 𝜎% ( 𝜎& ( − 𝜌) 𝜎% ) 𝜎& ) ) = (1 + 𝜌)(𝜇% ( − 𝜇% )) ∵これ以上計算できないのでガウス分布を仮定する ∵分散と相関が同じだと仮定しちゃおう! !! = #" !! $ = % " +1 −1 !% !! # " +1 −1 do ∵グラフより 統計家2の計算したものに⼀致する。 !! !" B A !" = !! ##
10 ちなみに 先に求めたものは、 𝑊" = 𝑤# の期待値をとったものになっている。 𝑃 𝑌 do
𝑋 = 𝑥 = : % 𝑃 𝑌 do 𝑋 = 𝑎 , 𝑊" = 𝑤 𝑃(𝑊" = 𝑤|do(𝑋 = 𝑥)) = : % 𝑃 𝑌 do 𝑋 = 𝑎 , do(𝑊" = 𝑤) 𝑃(𝑊" = 𝑤|do(𝑋 = 𝑥)) = : % 𝑃 𝑌 do 𝑋 = 𝑎 , do(𝑊" = 𝑤) 𝑃(𝑊" = 𝑤) ∵ 𝑊" をdoオペレーションしてもグラフが変わらない(次ページで補⾜) ∵因果モデルから𝑊" がdo(𝑋)よりも先に起こる(do条件の時使える式変形) 𝐸 𝑌 do 𝑋 = 𝑎, 𝑊" = 𝑤# = 𝜇! & − 𝜌& 𝜎! & 𝜎" & 𝑤# − 𝜇" & − 𝑤# 𝐸 𝑌 do 𝑋 = 𝑎 = 𝜇! & − 𝜌& 𝜎! & 𝜎" & 𝜇" − 𝜇" & − 𝜇" 統計家2のものと⽐較すると、𝑤# が𝜇" になっている。
11 補⾜ 𝑃 𝑌, 𝑊" do 𝑋 = 𝑥 =
𝑃 𝑌 do 𝑋 = 𝑥 , 𝑊" 𝑃 𝑊" do 𝑋 = 𝑥 = 𝑃 𝑌 do 𝑋 = 𝑥 , 𝑊" 𝑃(𝑊" ) 𝑃 𝑌, 𝑊" do 𝑋 = 𝑥 = 𝑃$ 𝑌, 𝑊" 𝑋 = 𝑥 = : % 𝑃$ (𝑌, 𝑊! = 𝑤, 𝑊" |𝑋 = 𝑥) = : % 𝑃$ 𝑌, 𝑊! = 𝑤, 𝑊" 𝑃$ 𝑊" 𝑃$ (𝑊! = 𝑤|𝑊" , 𝑋 = 𝑥) = : % 𝑃 𝑌, 𝑊! = 𝑤, 𝑊" 𝑃 𝑊" 𝑃 (𝑊! = 𝑤|𝑊" , 𝑋 = 𝑥) 𝑃 𝑌 do 𝑋 = 𝑥 , 𝑊" = 𝑤# = : % 𝑃 𝑌, 𝑊! = 𝑤, 𝑊" = 𝑤# 𝑃 (𝑊! = 𝑤|𝑊" = 𝑤# , 𝑋 = 𝑥) = 𝑃 𝑌 do 𝑋 = 𝑥, 𝑊" = 𝑤#
12 どちらが正しいのか 全員の体重を等しくした状態で、全員にミールプランAを⾷べさせた場合と全員にミールプランBを⾷べさせ た場合を⽐較する統計家2の⽅が正しい。 全員ミールプランA 全員ミールプランB 体重が同じ⼈達 ⽐較
13 解釈 体重が重い⼈の体重をキープできる定⾷Bは、体重が軽い⼈の体重をキープできる定⾷Aよりもカロリーが多 いはず! むしろ体重が変わらないことこそが、定⾷Bの体重増加効果を表している。 !! !" B A !"
= !! ## ⼒⼠の ちゃんこ鍋定⾷ ダイエット定⾷
14 平均への回帰? 体重が同じ⼈を集め、ダイエット定⾷Aとちゃんこ定⾷Bを⾷べさせると、Aを⾷べている⼈はダイエッターの 平均値に近づいていき、Bを⾷べている⼈は⼒⼠の平均に近づいていく。 𝑊" 𝑊! B A 𝑊! =
𝑊" 𝑤# 𝑤# ⼒⼠の平均へ ダイエッター の平均へ ここ怪しいので有識者はコメント下さい
15 統計家1との違い 𝐸 𝑊! − 𝑊" = : %,( 𝐸
𝑊! − 𝑊" |𝑊" = 𝑤, 𝑋 = 𝑥 𝑃(𝑊" = 𝑤, 𝑋 = 𝑥) = : % 𝐸 𝑊! − 𝑊" |𝑊" = 𝑤, 𝑋 = 𝑎 𝑃 𝑊" = 𝑤|𝑋 = 𝑎 𝑃(𝑋 = 𝑎) + 𝐸 𝑊! − 𝑊" |𝑊" = 𝑤, 𝑋 = 𝑏 𝑃 𝑊" = 𝑤 𝑋 = 𝑏 𝑃(𝑋 = 𝑏) 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑎 − 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑏 ←統計家2 基準がミールプランAの平均 基準がミールプランBの平均 ブラン内差の和 ブラン間の差 𝑊" 𝑊! B A 𝑊! = 𝑊" 𝜇" & 𝜇" ) 𝜇! ) 𝜇! & ←各ミールプランのグループでは体重変化はないのに、 全体で考えるとミールプランによる体重変化への影響が 現れるのはシンプソンのパラドックスに相当する。
別バリエーション
17 Lordが提⽰した元々のバリエーション ある全寮制の学校にて、年初と年末に体重を計測した。性別が体重に与える影響について調べたい。計測値は グラフのようになった。データ分析を⼆⼈の統計家に依頼したところ次の返事が返ってきた。 統計家1:𝑊! − 𝑊" を集計するとゼロになるので、性別で体重への影響はない。 統計家2:年初の体重が𝑤# の学⽣は男性の⽅が体重が増加しており、体重への影響がある。
(⾮現実的だが思考問題のために、𝑤# の値に依存しないと仮定する) 𝑊" 𝑊! m f 𝑊! = 𝑊" 𝑤#
18 因果モデル 𝑌 = 𝑊! − 𝑊" 、 𝑋を性別を表す確率変数と定義して、因果モデルを考える。 時系列を考えると性別が初期体重に影響を及ぼす可能性がある。
𝑊, 𝑊- 𝑋 𝑌 +1 −1
19 数式で考えよう 統計家1が計算しているもの。 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤#
, 𝑋 = 𝑚 − 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑓 > 0 𝐸 𝑊! − 𝑊" = 0 ∵グラフから 統計家2が計算しているもの。 𝐸 𝑊! − 𝑊" |do(𝑋 = 𝑚) − 𝐸 𝑊! − 𝑊" |do(𝑋 = 𝑓) = 𝐸 𝑊! − 𝑊" |𝑋 = 𝑚 − 𝐸 𝑊! − 𝑊" |𝑋 = 𝑓 = 0 ∵グラフから 統計家1に性別を考慮したものもゼロになる。 各項は𝑊! の期待値を取ればゼロになることに注意。
20 統計家2を深堀りする 統計家2の計算を制御された直接効果に変更する。 𝐸 𝑊% − 𝑊& do(𝑊& = 𝑤',
𝑋 = 𝑥) ( " 𝐸 𝑌, 𝑊% = 𝑤 do(𝑊& = 𝑤', 𝑋 = 𝑥) = ( " 𝐸! 𝑌 𝑊& = 𝑤', 𝑊% = 𝑤 𝑃!(𝑊%|𝑊& = 𝑤', 𝑋 = 𝑥) = ( " 𝐸 𝑌 𝑊& = 𝑤' , 𝑊% = 𝑤 𝑃(𝑊% |𝑊& = 𝑤' , 𝑋 = 𝑥) = ( " (𝑤 − 𝑤' )𝑃(𝑊% |𝑊& = 𝑤' , 𝑋 = 𝑥) = 𝐸 𝑊% − 𝑊& 𝑊& = 𝑤' , 𝑋 = 𝑚 = 𝜇% + − 𝜌+ 𝜎% + 𝜎& + 𝑤' − 𝜇& + − w' 𝐸 𝑊% − 𝑊& 𝑊& = 𝑤' , 𝑋 = 𝑚 − 𝐸 𝑊% − 𝑊& 𝑊& = 𝑤' , 𝑋 = 𝑓 = 𝜇% ! − 𝜌! 𝜎% ! 𝜎& ! 𝑤' − 𝜇& ! − w' − 𝜇% , + 𝜌, 𝜎% , 𝜎& , 𝑤' − 𝜇& , + w' = 𝜇% ! − 𝜇% , − 𝜌! 𝜎% ! 𝜎& ! 𝑤' − 𝜇& ! + 𝜌, 𝜎% , 𝜎& , 𝑤' − 𝜇& , ←統計家2と⼀致 !! !" " # +1 −1 !! !" " # +1 −1 do ∵ガウス分布を仮定
21 パラドックスの解消 統計家1ʻが集計したものは総合効果であり、統計家2が集計したものは制御された直接効果である。 数はモデルが線形の場合の因果効果を表している。 𝑊, 𝑊- 𝑋 𝑌 +1 −1
𝑏 = 𝜇! $ − 𝜇! * − 𝜌$ 𝜎! $ 𝜎" $ 𝑤# − 𝜇" $ + 𝜌* 𝜎! * 𝜎 " * 𝑤# − 𝜇" * 𝑎 = 𝜇" $ − 𝜇" * Direct Effect: 𝑏 > 0 Total Effect: 𝑏 − 𝑎 + 𝑎𝑐 = 0 ←統計家2 ←統計家1ʼ 𝑐
22 参考⽂献 • J. Pearl 他著/落海浩 訳,『⼊⾨統計的因果推論』, 朝倉書店, 2019年09⽉01⽇ •
Pearl, Judea. "Lordʼs Paradox Revisited ‒ (Oh Lord! Kumbaya!): " Journal of Causal Inference, vol. 4, no. 2, 2016, pp. 20160021. https://doi.org/10.1515/jci-2016-0021