Upgrade to Pro — share decks privately, control downloads, hide ads and more …

観察研究における因果推論

 観察研究における因果推論

More Decks by NearMeの技術発表資料です

Other Decks in Science

Transcript

  1. 5 ⽂献 Imbens GW, Rubin DB. Causal Inference for Statistics,

    Social, and Biomedical Sciences: An Introduction. Cambridge University Press; 2015. 邦訳インベンス、G. W. & ルービン、D. B. (2023). インベンス・ルービン統計的因果 推論上下. 朝倉書店. 邦訳 Pearl, J., Glymour, M., Jewell, N. P. (著), (2019). 入門 統計的因果推論 . 朝倉書店 2,3章: 有向非巡回グラフ・バックドアパス 1章: 潜在的結果フレームワーク 3, 12章: 割り当てメカニズム
  2. 6 ⽬次 • introduction • 潜在的結果フレームワーク ◦ 処置, 潜在的結果 ◦

    処置割り当てメカニズム • 有向⾮巡回グラフ ◦ バックドアパス ◦ 傾向スコア • 事例
  3. 7 Introduction: 統計的因果推論とは何か? • 統計的因果推論 = 反実仮想についての推論 • 例 ◦ 政策介⼊ ▪

    もし奨学⾦⽀援制度を開始は進学率を⾼めるか? ◦ 政治制度の経路依存効果 ▪ もしある地域で奴隷制が存在しなければ経済発展したか? ◦ 資源の呪い ▪ もしある国で⽯油が算出されなかったら⺠主化したか?
  4. 9 処置, 潜在的結果 • 処置 (treatment) • 潜在的結果 (potential outcome)

    ◦ ユニットiで処置dを受けた場合に実現する結果 • 観察される結果 (observed outcome) ◦ ユニットiで観察される結果 潜在的結果は確率変数でない(fixed)
  5. 10 処置, 潜在的結果 処置効果 • 因果効果 ユニット処置効果 ◦ 根本的問題 ▪

    問題⼆つの潜在的結果は同時に観測できない ▪ Y(1)とY(0)は同時に観察することができないため追加の仮定なしに因果効果を 求めることは不可能
  6. 11 処置, 潜在的結果 識別 • 識別のための⼆つの条件 • 操作可能性 ◦ 処置

    Di =d を研究者が操作することができれば ◦ = 研究者が処置を決定することができれば識別可能 • 識別のための仮定 SUTVA(Stable Unit Treatment Value Assumption) ◦ No interference between units ◦ Consistency ▪ どのユニットに対しても処置が同じ
  7. 12 処置, 潜在的結果 平均処置効果 • 平均処置効果(ATE: Average Treatment Effect) •

    ATT: Average Treatment Effect on the treated • selection bias: 割り当てメカニズムを考慮しないと? ◦ 何も考えず、処置群Di=1と対照群Di=0の平均の差を計算する selection bias ATT
  8. 15 処置割り当てメカニズム 正則な割り当て • 定義: Regular Assignment Mechanism ◦ individualistic:

    ▪ 処置割り当て確率が他のユニットの潜在的結果‧共変量と独⽴ ◦ probabilistic: ▪ どのユニットも処置割り当て確率が0か1ではない ◦ Uncorfounded: ▪ 処置割り当て確率は潜在的結果と独⽴
  9. 17 処置割り当てメカニズム 傾向スコア • 共変量が多すぎる...  → 次元の呪い ◦ 共変量が多次元になるほど同じ層のユニット数が極端に減少 ◦ 傾向スコア(propensity

    score)で低次元圧縮 • マッチング ◦ 処置群と統制群から「そっくりな」ユニットをペアにしてその結果の差を平均する ◦ 次元圧縮した傾向スコアでも⾏うことができる ※傾向スコアでのマッチングは推奨されない King, Gary and Richard Nielsen. 2019. “Why Propensity Scores Should Not Be Used for Matching.” Political Analysis 27(4): 435–454.
  10. 18 処置割り当てメカニズム: まとめ 特徴 無作為化実験 良い観察研究 良くない観察研究 処置と共変量の区別 明確 明確

    区別されていない Quantities of interest 明確 明確 不明確 処置の割当 無作為割当 無作為割当と想定可能 割当メカニズムを無視
  11. 19 有向⾮巡回グラフ(Directed Acyclic Graph) • 有向⾮巡回グラフ(DAG: Directed Acyclic Graph) ◦

    因果関係をグラフで表す(構造的因果モデル: SCM) ◦ ここでは有向で⾮巡回のグラフを想定する ◦ 後ページでは変数を条件づけると連鎖経路‧分岐経路では変数間が独⽴に、合流経 路では従属になることを⽰す ◦ • 例 たばこと肺炎 D: 喫煙 Y: 肺がん X: 遺伝子
  12. 20 有向⾮巡回グラフ(Directed Acyclic Graph): 分岐経路 • Y, DはZに従属 ◦ p(Y,

    D, Z) = p(Y|Z) p(D|Z) p(Z) • D, YはZの条件の下で独⽴ ◦ p(Y, D| Z) = p(Y, D, Z) /p(Z) = p(Y|Z) p(D|Z) p(Z)/p(Z) = p(Y|Z) p(D|Z) Z Y D
  13. 21 有向⾮巡回グラフ(Directed Acyclic Graph): 連鎖経路 • YはZ,Xに従属、ZはXに従属 ◦ p(Y, D,

    Z) = p(Y|Z) p(Z|D) p(D) • 連鎖経路ではZの条件下でDとYは独⽴ ◦ P(Y, D|Z) = P(Y, D, Z)/P(Z) = p(Y|Z) p(Z|D) p(D)/P(Z) = p(Y|Z) p(D|Z) Z Y D
  14. 22 有向⾮巡回グラフ(Directed Acyclic Graph): 合流経路 • ZはY, D に従属 ◦

    p(Y, D, Z) = p(Z|Y, D)p(Y)p(D) • Y, Dは独⽴ ◦ p(Y, D) = p(Y)p(D) • Y, DはZで条件づけると従属する ◦ p(Y, D|Z) = p(Z|Y, D)p(Y)p(D)/p(Z) Z Y D
  15. 23 有向⾮巡回グラフ(Directed Acyclic Graph): どの共変量を選択すべき? • むやみに共変量を選択してはいけないことがわかる ◦ 交絡要因: 分岐

    ▪ 条件づけない →  交絡バイアスcoufounding ◦ 処置後変数 ▪ 処置後変数(連鎖経路、合流経路)を条件づける → post-treatment bias • 複雑なDAGにどう対処する? ◦ →バックドアパス
  16. 24 有効⾮巡回グラフ(Directed Acyclic Graph): バックドアパス • ブロックされるパス ◦ パスpをブロックする集合S •

    pがSに含まれる⾮合流点を含む • pがそれ⾃体もその⼦孫も含まれない合流点を含む • バックドアパス(back-door paths) • バックドア基準 ◦ SはXの⼦孫を含まない ◦ SはXからYへのすべてのバックドアパスをブロックする →集合Sはバックドア基準を満たす • バックドア基準と conditional ignorability(≒Uncorfounded) は等価 W3 Y D W2 W2 Z3 Z2 Z1
  17. 26 観察研究での因果効果推定: 例 マッチング • The Political Price of Authoritarian Control:

    Evidence from Francoist Land Settlements in Spain • RQ ◦ 権威主義体制下における強権的政策の代償は? ◦ スペインフランコ政権科の強制移住政策が⺠主化後の政党⽀持に影響を与えたか? • データ ◦ Outcome ▪ 左派政党‧フランコ後継政党への投票 ◦ Treatment ▪ 強制移住政策の経験 • 分析⼿法 ◦ マッチング Albertus, Michael, The Political Price of Authoritarian Control: Evidence from Francoist Land Settlements in Spain (February 4, 2022). Available at SSRN: https://ssrn.com/abstract=3948952 or http://dx.doi.org/10.2139/ssrn.3948952
  18. 27 観察研究での因果効果推定: 例 マッチング • Treatmentの詳細 ◦ Land Settlementがされたか否か ◦ ⼤多数が政府が独⾃に指定した灌漑ゾーン内に

    ▪ 処理割り当てメカニズム! • マッチング ◦ 政府がLand Settlementしなかった反事実を形成 ▪ 政府が独⾃に指定した灌漑ゾーンおよびフィンカゾーン内に該当するが、新し い町が建設されていない⾃治体から 地理、農業適性、⼈⼝統計、国家能⼒に関 連する共変量に基づいた傾向スコアのロジット推定を使⽤して、⾮置換の neighbor matchingを実⾏. ▪ 州,灌漑ゾーンはexact matching Albertus, Michael, The Political Price of Authoritarian Control: Evidence from Francoist Land Settlements in Spain (February 4, 2022). Available at SSRN: https://ssrn.com/abstract=3948952 or http://dx.doi.org/10.2139/ssrn.3948952
  19. 31 観察研究での因果効果推定: ⼿法まとめ • weighting, mathing ◦ 正しいDAGを仮定することができる場合 • 操作変数法(instrumental

    variables) ◦ 処置割り当てに影響を与えるランダム化されている + 直接結果に影響を与えることのない変数 • Difference in difference(DiD) ◦ over-time variation + parallel trend assumption • Regression discontinuity (RD) ◦ arbitrary thresholds for treatment assignment (continuity assumption) • Synthetic control method ◦ over-time variation + no large idiosyncratic shocks + no anticipation + sufficient pre-intervention information + sufficient post-intervention information