Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Lordのパラドックス

 Lordのパラドックス

Pythonデータ分析勉強会#29 の発表資料です。
https://pythondata.connpass.com/event/221652/

Masafumi Abeta

August 27, 2021
Tweet

More Decks by Masafumi Abeta

Other Decks in Science

Transcript

  1. 3 数式で考えよう 統計家1が計算しているもの。 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤#

    , 𝑋 = 𝑎 − 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑏 𝐸 𝑊! − 𝑊" = 0 統計家2が計算しているもの。 ∵グラフから
  2. 5 統計家1を深堀りしてみる ミールプランの違いを考慮していないので、ミールプランごとに計算してみよう。 𝐸 𝑊! − 𝑊" do 𝑋 =

    𝑎 − 𝐸[𝑊! − 𝑊" |do(𝑋 = 𝑏)] グラフから同時分布を求め、条件付き分布を求める。 𝑃 𝑌 do 𝑋 = 𝑥 = 𝑃! 𝑌 𝑋 = 𝑥 = ( ","$ 𝑃!(𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤′|𝑋 = 𝑥) = ( ","$ 𝑃! 𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤$ 𝑃! 𝑊& = 𝑤$ 𝑃!(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) = ( ","$ 𝑃 𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤$ 𝑃 𝑊& = 𝑤$ 𝑃(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) ⇒ 𝐸 𝑌 do 𝑋 = 𝑥 = ( ","$ 𝐸 𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤$ 𝑃 𝑊& = 𝑤$ 𝑃(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) = ( ","$ (𝑤 − 𝑤′)𝑃 𝑊& = 𝑤$ 𝑃(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) !! !" ! = # " +1 −1 !! !" # " +1 −1 do
  3. 6 ミールプランの効果 𝐸 𝑌 do 𝑋 = 𝑎 = (

    !,!# (𝑤 − 𝑤′)𝑃 𝑊$ = 𝑤# 𝑃(𝑊% = 𝑤|𝑊$ = 𝑤#, 𝑋 = 𝑎) = ( !,!# 𝑤𝑃(𝑊% = 𝑤|𝑊$ = 𝑤#, 𝑋 = 𝑎) 𝑃 𝑊$ = 𝑤# − ( !! 𝑤#𝑃 𝑊$ = 𝑤# = ( !# 𝐸(𝑊% |𝑊$ = 𝑤#, 𝑋 = 𝑎) 𝑃 𝑊$ = 𝑤# − 𝐸 𝑊$ = ( !# (𝜇% & − 𝜌& 𝜎% & 𝜎$ & 𝑤# − 𝜇$ & )𝑃 𝑊$ = 𝑤# − 𝜇$ = 𝜇% & − 𝜌& 𝜎% & 𝜎$ & 𝜇$ − 𝜇$ & − 𝜇$ = (𝜇% &−𝜇$ ) 1 + 𝜌& 𝜎% & 𝜎$ & < 0 𝑃 𝑌 do 𝑋 = 𝑎 − 𝑃 𝑌 do 𝑋 = 𝑏 = (𝜇% &−𝜇$ ) 1 + 𝜌& 𝜎% & 𝜎$ & − (𝜇% '−𝜇$ ) 1 + 𝜌' 𝜎% ' 𝜎$ ' (< 0) = 𝜇% & 1 + 𝜌& 𝜎% & 𝜎$ & − 𝜇% ' 1 + 𝜌' 𝜎% ' 𝜎$ ' − 𝜇$ (𝜌& 𝜎% & 𝜎$ & − 𝜌' 𝜎% ' 𝜎$ ' ) = 1 + 𝜌 𝜇% & − 𝜇% ' ∵これ以上計算できないのでガウス分布を仮定する ∵分散と相関が同じだと仮定しちゃおう! ∵グラフより !! !" B A !" = !! ## 𝑃 𝑌 do 𝑋 = 𝑏 = (𝜇% '−𝜇$ ) 1 + 𝜌' 𝜎% ' 𝜎$ ' > 0
  4. 7 統計家2を深堀りしてみよう 統計家2が計算したかったであろうもの。 𝐸 𝑊! − 𝑊" do 𝑋 =

    𝑎, 𝑊" = 𝑤# − 𝐸[𝑊! − 𝑊" |do(𝑋 = 𝑏, 𝑊" = 𝑤# )] 𝑊$ = 𝑤( 𝑊- 𝑋 = 𝑥 𝑌 +1 −1 これで計算できるのは、ミールプランが𝑌に与える「制御された直接効果」である。 𝑊, 𝑊- 𝑋 𝑌 +1 −1 do
  5. 8 制御された直接効果を計算しよう (1/2) !! = #" !! $ = %

    " +1 −1 !% !! # " +1 −1 do 𝑃 𝑌 do 𝑋 = 𝑥, 𝑊" = 𝑤# = 𝑃$ 𝑌 𝑋 = 𝑥, 𝑊" = 𝑤# 定義から、 𝑃$ 𝑌, 𝑋, 𝑊" , 𝑊! = 𝑃$ 𝑌 𝑊" , 𝑊! 𝑃$ 𝑊" 𝑃$ 𝑊! 𝑊" , 𝑋 𝑃$ 𝑋 ⇒ 𝑃$ 𝑌, 𝑋, 𝑊" = : % 𝑃$ 𝑌 𝑊" , 𝑊! = 𝑤 𝑃$ 𝑊" 𝑃$ 𝑊! = 𝑤 𝑊" , 𝑋 𝑃$ 𝑋 ⇒ 𝑃$ 𝑌|𝑋, 𝑊" = : % 𝑃$ 𝑌 𝑊" , 𝑊! = 𝑤 𝑃$ 𝑊" 𝑃$ 𝑊! = 𝑤 𝑊" , 𝑋 𝑃$ 𝑋 /𝑃$ (𝑋, 𝑊" ) = : % 𝑃$ 𝑌 𝑊" , 𝑊! = 𝑤 𝑃$ 𝑊! = 𝑤 𝑊" , 𝑋 = : % 𝑃 𝑌 𝑊" , 𝑊! = 𝑤 𝑃 𝑊! = 𝑤 𝑊" , 𝑋 グラフから同時分布を求め、条件付き分布を求める。
  6. 9 制御された直接効果を計算しよう (2/2) 𝐸 𝑌 do 𝑋 = 𝑎, 𝑊&

    = 𝑤' = ( " 𝐸 𝑌 𝑊& = 𝑤' , 𝑊% = 𝑤 𝑃 𝑊% = 𝑤 𝑊& = 𝑤' , 𝑋 = 𝑎 = ( " (𝑤 − 𝑤')𝑃 𝑊% = 𝑤 𝑊& = 𝑤', 𝑋 = 𝑎 = ( " 𝑤𝑃 𝑊% = 𝑤 𝑊& = 𝑤' , 𝑋 = 𝑎 − 𝑤' = 𝐸 𝑊% 𝑊& = 𝑤' , 𝑋 = 𝑎 − 𝑤' = 𝜇% ( − 𝜌( 𝜎% ( 𝜎& ( 𝑤' − 𝜇& ( − 𝑤' 𝐸 𝑌 do 𝑋 = 𝑎, 𝑊& = 𝑤' − 𝐸 𝑌 do 𝑋 = 𝑏, 𝑊& = 𝑤' = 𝜇% ( − 𝜇% ) − 𝜌( 𝜎% ( 𝜎& ( 𝑤' − 𝜇& ( + 𝜌) 𝜎% ) 𝜎& ) 𝑤' − 𝜇& ) (< 0) = 𝜇% ( 1 + 𝜌( 𝜎% ( 𝜎& ( − 𝜇% ) 1 + 𝜌) 𝜎% ) 𝜎& ) − 𝑤'(𝜌( 𝜎% ( 𝜎& ( − 𝜌) 𝜎% ) 𝜎& ) ) = (1 + 𝜌)(𝜇% ( − 𝜇% )) ∵これ以上計算できないのでガウス分布を仮定する ∵分散と相関が同じだと仮定しちゃおう! !! = #" !! $ = % " +1 −1 !% !! # " +1 −1 do ∵グラフより 統計家2の計算したものに⼀致する。 !! !" B A !" = !! ##
  7. 10 ちなみに 先に求めたものは、 𝑊" = 𝑤# の期待値をとったものになっている。 𝑃 𝑌 do

    𝑋 = 𝑥 = : % 𝑃 𝑌 do 𝑋 = 𝑎 , 𝑊" = 𝑤 𝑃(𝑊" = 𝑤|do(𝑋 = 𝑥)) = : % 𝑃 𝑌 do 𝑋 = 𝑎 , do(𝑊" = 𝑤) 𝑃(𝑊" = 𝑤|do(𝑋 = 𝑥)) = : % 𝑃 𝑌 do 𝑋 = 𝑎 , do(𝑊" = 𝑤) 𝑃(𝑊" = 𝑤) ∵ 𝑊" をdoオペレーションしてもグラフが変わらない(次ページで補⾜) ∵因果モデルから𝑊" がdo(𝑋)よりも先に起こる(do条件の時使える式変形) 𝐸 𝑌 do 𝑋 = 𝑎, 𝑊" = 𝑤# = 𝜇! & − 𝜌& 𝜎! & 𝜎" & 𝑤# − 𝜇" & − 𝑤# 𝐸 𝑌 do 𝑋 = 𝑎 = 𝜇! & − 𝜌& 𝜎! & 𝜎" & 𝜇" − 𝜇" & − 𝜇" 統計家2のものと⽐較すると、𝑤# が𝜇" になっている。
  8. 11 補⾜ 𝑃 𝑌, 𝑊" do 𝑋 = 𝑥 =

    𝑃 𝑌 do 𝑋 = 𝑥 , 𝑊" 𝑃 𝑊" do 𝑋 = 𝑥 = 𝑃 𝑌 do 𝑋 = 𝑥 , 𝑊" 𝑃(𝑊" ) 𝑃 𝑌, 𝑊" do 𝑋 = 𝑥 = 𝑃$ 𝑌, 𝑊" 𝑋 = 𝑥 = : % 𝑃$ (𝑌, 𝑊! = 𝑤, 𝑊" |𝑋 = 𝑥) = : % 𝑃$ 𝑌, 𝑊! = 𝑤, 𝑊" 𝑃$ 𝑊" 𝑃$ (𝑊! = 𝑤|𝑊" , 𝑋 = 𝑥) = : % 𝑃 𝑌, 𝑊! = 𝑤, 𝑊" 𝑃 𝑊" 𝑃 (𝑊! = 𝑤|𝑊" , 𝑋 = 𝑥) 𝑃 𝑌 do 𝑋 = 𝑥 , 𝑊" = 𝑤# = : % 𝑃 𝑌, 𝑊! = 𝑤, 𝑊" = 𝑤# 𝑃 (𝑊! = 𝑤|𝑊" = 𝑤# , 𝑋 = 𝑥) = 𝑃 𝑌 do 𝑋 = 𝑥, 𝑊" = 𝑤#
  9. 15 統計家1との違い 𝐸 𝑊! − 𝑊" = : %,( 𝐸

    𝑊! − 𝑊" |𝑊" = 𝑤, 𝑋 = 𝑥 𝑃(𝑊" = 𝑤, 𝑋 = 𝑥) = : % 𝐸 𝑊! − 𝑊" |𝑊" = 𝑤, 𝑋 = 𝑎 𝑃 𝑊" = 𝑤|𝑋 = 𝑎 𝑃(𝑋 = 𝑎) + 𝐸 𝑊! − 𝑊" |𝑊" = 𝑤, 𝑋 = 𝑏 𝑃 𝑊" = 𝑤 𝑋 = 𝑏 𝑃(𝑋 = 𝑏) 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑎 − 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑏 ←統計家2 基準がミールプランAの平均 基準がミールプランBの平均 ブラン内差の和 ブラン間の差 𝑊" 𝑊! B A 𝑊! = 𝑊" 𝜇" & 𝜇" ) 𝜇! ) 𝜇! & ←各ミールプランのグループでは体重変化はないのに、 全体で考えるとミールプランによる体重変化への影響が 現れるのはシンプソンのパラドックスに相当する。
  10. 19 数式で考えよう 統計家1が計算しているもの。 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤#

    , 𝑋 = 𝑚 − 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑓 > 0 𝐸 𝑊! − 𝑊" = 0 ∵グラフから 統計家2が計算しているもの。 𝐸 𝑊! − 𝑊" |do(𝑋 = 𝑚) − 𝐸 𝑊! − 𝑊" |do(𝑋 = 𝑓) = 𝐸 𝑊! − 𝑊" |𝑋 = 𝑚 − 𝐸 𝑊! − 𝑊" |𝑋 = 𝑓 = 0 ∵グラフから 統計家1に性別を考慮したものもゼロになる。 各項は𝑊! の期待値を取ればゼロになることに注意。
  11. 20 統計家2を深堀りする 統計家2の計算を制御された直接効果に変更する。 𝐸 𝑊% − 𝑊& do(𝑊& = 𝑤',

    𝑋 = 𝑥) ( " 𝐸 𝑌, 𝑊% = 𝑤 do(𝑊& = 𝑤', 𝑋 = 𝑥) = ( " 𝐸! 𝑌 𝑊& = 𝑤', 𝑊% = 𝑤 𝑃!(𝑊%|𝑊& = 𝑤', 𝑋 = 𝑥) = ( " 𝐸 𝑌 𝑊& = 𝑤' , 𝑊% = 𝑤 𝑃(𝑊% |𝑊& = 𝑤' , 𝑋 = 𝑥) = ( " (𝑤 − 𝑤' )𝑃(𝑊% |𝑊& = 𝑤' , 𝑋 = 𝑥) = 𝐸 𝑊% − 𝑊& 𝑊& = 𝑤' , 𝑋 = 𝑚 = 𝜇% + − 𝜌+ 𝜎% + 𝜎& + 𝑤' − 𝜇& + − w' 𝐸 𝑊% − 𝑊& 𝑊& = 𝑤' , 𝑋 = 𝑚 − 𝐸 𝑊% − 𝑊& 𝑊& = 𝑤' , 𝑋 = 𝑓 = 𝜇% ! − 𝜌! 𝜎% ! 𝜎& ! 𝑤' − 𝜇& ! − w' − 𝜇% , + 𝜌, 𝜎% , 𝜎& , 𝑤' − 𝜇& , + w' = 𝜇% ! − 𝜇% , − 𝜌! 𝜎% ! 𝜎& ! 𝑤' − 𝜇& ! + 𝜌, 𝜎% , 𝜎& , 𝑤' − 𝜇& , ←統計家2と⼀致 !! !" " # +1 −1 !! !" " # +1 −1 do ∵ガウス分布を仮定
  12. 21 パラドックスの解消 統計家1ʻが集計したものは総合効果であり、統計家2が集計したものは制御された直接効果である。 数はモデルが線形の場合の因果効果を表している。 𝑊, 𝑊- 𝑋 𝑌 +1 −1

    𝑏 = 𝜇! $ − 𝜇! * − 𝜌$ 𝜎! $ 𝜎" $ 𝑤# − 𝜇" $ + 𝜌* 𝜎! * 𝜎 " * 𝑤# − 𝜇" * 𝑎 = 𝜇" $ − 𝜇" * Direct Effect: 𝑏 > 0 Total Effect: 𝑏 − 𝑎 + 𝑎𝑐 = 0 ←統計家2 ←統計家1ʼ 𝑐
  13. 22 参考⽂献 • J. Pearl 他著/落海浩 訳,『⼊⾨統計的因果推論』, 朝倉書店, 2019年09⽉01⽇ •

    Pearl, Judea. "Lordʼs Paradox Revisited ‒ (Oh Lord! Kumbaya!): " Journal of Causal Inference, vol. 4, no. 2, 2016, pp. 20160021. https://doi.org/10.1515/jci-2016-0021