Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サイゼミ用因果推論
Search
LW
January 27, 2025
Science
0
910
サイゼミ用因果推論
LW@lw_ruがサイゼミ用に作った因果推論の説明資料
LW
January 27, 2025
Tweet
Share
Other Decks in Science
See All in Science
ベイズ最適化をゼロから
brainpadpr
2
1k
学術講演会中央大学学員会いわき支部
tagtag
0
120
Mechanistic Interpretability の紹介
sohtakahashi
0
500
論文紹介: PEFA: Parameter-Free Adapters for Large-scale Embedding-based Retrieval Models (WSDM 2024)
ynakano
0
200
Introduction to Image Processing: 2.Frequ
hachama
0
420
Snowflakeによる統合バイオインフォマティクス
ktatsuya
PRO
0
570
深層学習を利用して 大豆の外部欠陥を判別した研究事例の紹介
kentaitakura
0
270
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
120
証明支援系LEANに入門しよう
unaoya
0
550
マテリアルズ・インフォマティクスの先端で起きていること / What's Happening at the Cutting Edge of Materials Informatics
snhryt
1
170
How were Quaternion discovered
kinakomoti321
2
1.2k
はじめての「相関と因果とエビデンス」入門:“動機づけられた推論” に抗うために
takehikoihayashi
17
7.1k
Featured
See All Featured
A better future with KSS
kneath
238
17k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
11
890
Writing Fast Ruby
sferik
628
61k
Building Better People: How to give real-time feedback that sticks.
wjessup
366
19k
Code Review Best Practice
trishagee
65
17k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
49
2.2k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
2k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
6
210
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
27
1.9k
The World Runs on Bad Software
bkeepers
PRO
66
11k
Fireside Chat
paigeccino
34
3.2k
Fontdeck: Realign not Redesign
paulrobertlloyd
82
5.3k
Transcript
第17回サイゼミ 因果推論パート 「相関関係は因果関係ではない」 のワンランク上に行く! LW@lw_ru 2025/1/26 水天宮前 1
もう「相関関係は因果関係でない」くらい誰でも知ってる時代 ・データ教育の充実によるベースライン向上 ・SNSのレスバにおける必殺技(不毛) この環境でワンランク上に行くためには…… ・因果関係でなかったら何なの? ・因果関係はどうすれば言える? という肯定形の知見を持っておきたい(割と難しい) 2 背景:データリテラシー向上とレスバの成熟
目標:「相関関係は因果関係ではない」のワンランク上へ ステップ1(定義):そもそも相関関係と因果関係はどう違う? ステップ2(種類):では因果関係ではない相関関係は何? ステップ3(方法):どうすれば相関関係から因果関係がわかる? ステップ4(困難):なぜ因果関係は難しいのか? ※今回は哲学ではなく数理の話です 3 本日の目標
定義: そもそも相関関係と 因果関係はどう違う? ステップ1 4
▪相関関係:観察結果 5 相関関係と因果関係の違い ▪因果関係:メカニズム Xが大きいときYも大きい(正の相関関係) Xが大きいときYは小さい(負の相関関係) ※厳密には線形関係に限るが気にしなくていい Xを大きくするとYも大きくなる(正の因果効果) Xを大きくするとYは小さくなる(負の因果効果) ※Xが原因でYが結果(X→Yと書く)
例)X:海難事故件数 Y:アイスの消費量 例)X:気温 Y:アイスの消費量 XとYの間に方向がない XとYの間に方向がある(X→YとY→Xを区別) 現象を記録した観察データを分析する 現象に介入した実験データを分析する 静的・過去的(かつて起きたことを検討) 動的・未来的(これから起こすことを検討) X Y
▪相関関係と因果関係の有無に対応する様々なケース 6 相関関係と因果関係のパターン 因果関係 あり 因果関係 なし 相関関係 あり X:摂取カロリー
Y:体重 直感的に関係あるものはここ X:海難事故件数 Y:アイスの消費量 色々なパターンがある 相関関係 なし X:深夜勉強時間 Y:テスト点数 疲労と成長が打ち消し合う場合 超特殊なレアケース X:俺の腹筋回数 Y:SONYの株価 世界の関係のほぼ全てはここ
▪因果関係あるなら相関関係あり、相関関係あっても因果関係は不明 7 相関関係と因果関係のパターン 因果関係 あり 因果関係 なし 相関関係 あり X:摂取カロリー
Y:体重 直感的に関係あるものはここ X:海難事故件数 Y:アイスの消費量 色々なパターンがある 相関関係 なし X:深夜勉強時間 Y:テスト点数 疲労と成長が打ち消し合う場合 超特殊なレアケース X:俺の腹筋回数 Y:任天堂の株価 世界の関係のほぼ全てはここ 特殊なので除外 あんまり興味を持つことがない 「相関関係があるとき因果関係があるか」が問題になりがち 例えば「X:睡眠時間 Y:年収」はどっち!? とりあえず因果関係ありなら相関関係ありと思ってOK
種類: では因果関係ではない 相関関係は何? ステップ2 8
▪状況整理:相関関係から因果関係を知りたい データを見てXY間に相関関係が存在することは既にわかっている XとYの背後にある因果構造を知りたい! 1. XY間に相関関係が発生する因果構造のパターンを全て洗い出す (どれかには該当しているはず) 2. 今回のケースがどのパターンに該当するのかを確かめる (特にX→Yのパターンに該当するかチェック) 9
今から考えるべき問題 事 故 ア イ ス 本当にX→Yなのか……? 事 故 ア イ ス 気 温 ※:因果構造とは 「因果関係が作る構造」くらいの意味
▪XY間に相関関係がある前提での、因果構造の全パターン (これら全てのケースでXY間に相関関係が生じている) 10 相関関係が発生するパターン集 X Y X Y Z X
Y Z X Y Z X Y X Y 何もないケース 直接因果関係があるケース 直接因果関係はないが 第三変数Zが仲介するケース X Y Z ←Z固定時のみ (あとで解説) たまたま似た 1 2 3 4 5 6 7
▪ XY間に相関関係がある前提での、因果構造の全パターン 11 相関関係が発生するパターン集 X Y X Y Z X
Y Z X Y Z X Y X Y 何もないケース 直接因果関係があるケース 直接因果関係はないが 第三変数Zが仲介するケース X Y Z ←Z固定時のみ (あとで解説) たまたま似た X→Yの因果関係がある ケースはこれしかない!! このケースの扱いは状況による 間接的な因果関係しかない(直接はない)
▪何もないけどたまたま似たケース 例)離婚率とマーガリン消費量 意外とバカにできない!! 世界の関係は多すぎるから 探せばいくらでも相関関係のペアは作れる 運ゲーなのでたまたまハマると最悪 12 相関関係が発生するパターン集 X Y
たまたま似た
▪直接因果関係があるケース 観察データだけでは向きが確定できないことに注意 よく考えずに逆の介入が決行されることもよくある 例)X:課金額→Y:アイテムY 実際は課金するとアイテムYを貰えるだけ(X→Y) でも「アイテムYを与えると課金額が増えるのでは ……?」などと考えがち!! (Y→X) 13 相関関係が発生するパターン集
X Y X Y 直接因果関係があるケース
▪チェーン(連鎖)による仲介 X→Yは直接繋がっていない Z次第で相関関係が消えてしまう 例)X:炎→Z:煙→ Y:火災報知器(煙検知式) 通常はX→Yだが炎自体ではなく煙を検知している 火災報知器をカバーで覆うと鳴らなくなる X→YとX→Z→Yが同時発生するケースも多い 例)X:頑張り →
Z:結果→ Y:評価 結果次第で頑張りから評価への効果が上下 14 相関関係が発生するパターン集 X Y Z X Y Z X Y Z 直接因果関係はないが 第三変数Zが仲介するケース X Y Z ←Z固定時のみ (あとで解説) X Y Z
▪フォーク(分岐)による仲介 最も典型的な疑似相関(交絡とも言う) 例)X:アイス消費← Z:気温→Y:海難事故件数 Zには根本的で抽象的な量が入ることが多い 例)X:ログイン数← Z:モチベ→Y:課金額 Zへの干渉は難しくてお手上げになりがち 「それが出来たら苦労はしないよ」 15
相関関係が発生するパターン集 X Y Z X Y Z X Y Z 直接因果関係はないが 第三変数Zが仲介するケース X Y Z ←Z固定時のみ (あとで解説)
▪コライダー(衝突)による仲介 やや知名度が低いワンランク上のケース Zをある値や範囲に固定したとき疑似相関発生 例)X:数学の点→Z:合計点← Y:国語の点 合計100点で固定すればXとYの間に負の相関 (ある会社内で)能力高いやつは性格悪い傾向 があるのもこのメカニズム 16 相関関係が発生するパターン集
X Y Z X Y Z X Y Z 直接因果関係はないが 第三変数Zが仲介するケース X Y Z ←Z固定時のみ (あとで解説)
方法: どうすれば相関関係から 因果関係がわかる? ステップ3 17
▪状況整理 XとYに相関関係があることはデータからわかった (データから機械的に計算可能) 背景の因果構造は7種類のどれかのはず…… で、どれ!? 18 今から考えるべき問題 X Y X
Y Z X Y Z X Y Z X Y X Y X Y Z たまたま似た 1 2 3 4 5 6 7
▪相関関係から因果関係を調べる方法 19 三つの大方針 ①常識で考える! ②実験する! ③分析する! ※「実験」と「分析」はほぼ専門用語 かなり狭い意味で異なる方法論を指す 「実験して分析する」みたいな日常語ではない
▪常識で考える! 意外と重要 これでかなり絞り込めるため 例)性別、時給、労働時間、年収(全729通り) 20 相関関係から因果関係を調べる方法①:常識 常識で考える! 性 別 年
収 労 働 時 間 時 給 性 別 年 収 労 働 時 間 時 給 性 別 年 収 労 働 時 間 時 給 有り得る 調べる価値あり 有り得ない 時間の無駄!
▪実験する! X→Yを確かめるため、実際にXに介入すること 例)X:毒→Y:死 ただしX以外の原因でYが起こらないように工夫して比較する 1.全ての条件を揃える(直感的だが基本無理) 双子の一方にだけ毒を注入して比較 毒以外の条件が同じなので純粋な毒の効果がわかる 2.ランダムに割り当てる(よくやるやつ) 全人類のランダムで半数に毒を注入して比較 毒以外の影響が均されるので平均的な毒の効果がわかる
※ Zが絡んでいるケースでも有効! ※ 観察データと実験データで読み方が変わることに注意! 21 相関関係から因果関係を調べる方法②:実験 実験する!
▪分析する! 第三変数Zが仲介するケースでZを排除すること(因果分析) Zの固定を切り替えて XとYの相関を調べると Zの影響を排除した XとYの直接相関がわかる 22 相関関係から因果関係を調べる方法:③分析 分析する! X
Y Z X Y Z X Y Z X Y Z
▪フォーク(分岐)でZを固定して影響を排除 例)X:アイス消費← Z:気温→Y:海難事故件数 気温25℃のときのデータだけ見ればよくない? ↓ アイス消費量と海難事故件数に相関がなくなり、 この二つに直接の相関がないことがわかる! 23 相関関係から因果関係を調べる方法:③分析 X
Y Z X Y Z X Y Z X Y Z Zの固定を切り替えて XとYの相関を調べると Zの影響を排除した XとYの直接相関がわかる
▪チェーン(連鎖)でZを固定して影響を排除 例)X:炎→Z:煙→ Y:火災報知器 煙が出てないときのデータだけ見ればよくない? ↓ 炎と火災報知器の相関が消える(絶対鳴らない) この二つに直接の相関がないことがわかる! 24 相関関係から因果関係を調べる方法:③分析 X
Y Z X Y Z X Y Z X Y Z Zの固定を切り替えて XとYの相関を調べると Zの影響を排除した XとYの直接相関がわかる
▪コライダー(衝突)でZを動かして影響を排除 例) X:数学の点→Z:合計点← Y:国語の点 (Zを100点に固定したときXとYに負の相関) 100点以外の合計点も見ればよくない? ↓ 数学と国語の点に相関がなくなれば、 この二つに直接の相関がないことがわかる! 25
相関関係から因果関係を調べる方法:③分析 X Y Z X Y Z X Y Z X Y Z Zの固定を切り替えて XとYの相関を調べると Zの影響を排除した XとYの直接相関がわかる
困難: なぜ因果関係は 難しいのか? ステップ4 26
▪どの方法にも欠陥がある!! 27 大方針それぞれの欠陥 常識で考える! 実験する! 分析する! ある程度はわかるが 全てわかるわけではない 実験できない状況が多い サンプル数や倫理の問題
実は理論的に確定できないし 世界の因子は多すぎる
▪常識路線の欠陥 既知の知見でわからないことを知りたいので 全て常識で決めようとするのは本末転倒 絞り込むだけで結論までは出せない ただ頑張って実験・分析するより専門家に聞けば 済むことは割とよくある 28 因果関係を調べる方法の欠陥:①常識 常識で考える!
▪実験路線の欠陥 そう簡単に実験できないのが現実 ・介入自体に問題がある 有害かもしれない薬を飲ませられない ソシャゲでユーザー間に意味もなく差をつけられない ・実験用の集団が確保できない ある病気にかかっている人自体が少ない ・状況の偏りをコントロールできない あらゆる消費行動にコロナの影響が付きまとうここ数年! 29
因果関係を調べる方法の欠陥:②実験 実験する!
▪分析路線の欠陥 1. 理論的な限界 Zを固定したらXとYに相関がなくなったとする よく考えたらチェーンかフォークか区別できなくね? 2. 現実的な限界 未知因子の影響を完全に排除することは不可能 世界の要素は無限にあるので…… 30
因果関係を調べる方法の欠陥:③分析 分析する! X Y Z X Y Z X Y Z α β
まとめ あと余談 31
・相関関係は観察から判明、因果関係は介入から判明 ・「相関関係あり、因果関係なし」には色々なパターンがある ・常識、実験、分析によって背後の因果構造を確かめられる ・ただし因果の検証には限界があり万能の方法はない 32 まとめ 完