Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Pythonライブラリ"DoWhy"を用いた因果推論

うとしん
September 24, 2022
3.1k

 Pythonライブラリ"DoWhy"を用いた因果推論

2022/09/24のLT資料です。統計的因果推論のためのPythonライブラリ"DoWhy"についてLTしました。

うとしん

September 24, 2022
Tweet

Transcript

  1. - モデルを作成し、グラフ(DAG: 因果ダイアグラム)を描画 Model causal mechanisms DAGってこんなの クーポン配布 (CRMにて) -

    顧客ランクが高い人は売上が高い - 顧客ランクが高い人はクーポン配布 - クーポン配布すると売上 UP 売上 顧客ランク これをDAGで描くと...
  2. Identify the target estimand - 手元のデータから、因果効果を推定するために必要な仮定や推定 手法を出力 - 大きく3パターン -

    backdoor: バックドア基準 - frontdoor: フロントドア基準 - iv: 操作変数 説明は割愛します(詳細は「Causal Inference What If(無料)」を参照)
  3. Refute estimate - 推定の際に仮定した条件が正しいとは限らないため、推定結果の 頑健性(robustness)を確認する作業(感度分析) - DoWhyの公式ドキュメントでは4つの手法が紹介されている 1. Adding a

    random common cause variable 2. Replacing treatment with a random (placebo) variable 3. Removing a random subset of the data 4. Adding an unobserved common cause variable 1つ1つの説明は割愛します(簡単な説明は公式ドキュメント参照)
  4. データの生成(出力結果) y: アウトカム変数 v: 処置変数 X: アウトカムだけに影 響を与える変数 Z: 処置だけに影響を与

    える変数 W: 交絡因子 (ex) 部下の待遇 (ex) 上司の部下育成への熱意 (ex) 部下の満足度 (ex) マネジメント研修 (ex) 過去の研修の受講経験 (ex)は「マネジメント研修」が「部下の会社へ の満足度の向上」にどれほど影響を与えるか を推定するという例
  5. 参考文献 テキスト URL DoWhy公式ドキュメント https://py-why.github.io/dowhy/v0.8/getting_started/intro.html # 統計的因果推論のためのPythonライブラリDoWhyに ついて解説(KRSKさん) https://www.krsk-phs.com/entry/2018/08/22/060844 DoWhyによる統計的因果推論(kumalphaさん)

    https://qiita.com/kumalpha/items/a1177eb5af6168e8113d Causal Inference What If(pdf) https://cdn1.sph.harvard.edu/wp-content/uploads/sites/1268/ 2022/09/hernanrobins_WhatIf_15sep22.pdf Causal Inference In Statistics(pdf) https://www.datascienceassn.org/sites/default/files/CAUSAL %20INFERENCE%20IN%20STATISTICS.pdf