Upgrade to Pro — share decks privately, control downloads, hide ads and more …

因果推論と機械学習

 因果推論と機械学習

JST CRDS 俯瞰ワークショップ 機械学習と数学

Avatar for Shohei SHIMIZU

Shohei SHIMIZU

March 17, 2026
Tweet

More Decks by Shohei SHIMIZU

Other Decks in Science

Transcript

  1. 「統計的」因果推論 (因果AI) ◼“通常”のAI: 相関に基づく予測 • チョコ消費量がこのくらいなら ノーベル賞の数はどのくらい? ◼因果AI • チョコ消費量を増やすと

    ノーベル賞の数は増える? (介入効果) ◼無作為化実験により データを集めるのはしばしば困難 ◼それ以外の観察データを活用 3 Messerli, (2012), New England Journal of Medicine ノ ー ベ ル 賞 受 賞 者 の 数 相関係数: 0.79 チョコレート消費量
  2. 因果推論の手順の典型例 (Pearl, 2001) 1. 背景知識を用いて因果構造を表すグラフを描く 2. どの変数を分析に含めるかを、数学的理論から導き、 介入効果を推定 5 チョコ

    賞 GDP 因果グラフ 共通原因 Judea Pearl はチューリング賞(2011年)を受賞: それまで曖昧だった因果の概念を数学的に定式化し、 因果推論の理論体系を確立した功績
  3. 因果探索 (Spirtes et al., 2001; 清水, 2017; Shimizu, 2022) ◼仮定+データ

    → 因果探索 → 因果グラフ Maeda and Shimizu (2020) 仮定(+背景知識) 推測 • 関数形 • 分布 • 未観測共通原因の有無 • 非巡回 or 巡回 など データ 因果グラフ 探索スペースを決める データと照らし合わせる 残った候補 7 𝑦 = 𝑓 𝑥, 𝑢, 𝑒
  4. 因果探索の応用例2: 材料科学 ◼機械学習による予測 + 因果探索 ◼なぜ予測に効くのか: 因果関係 or (因果でない)相関関係? •

    因果経路 (メカニズム)・支配因子 9 記述子 材料特性 ? 記述子 材料特性 or 記述子 材料特性 or 共通原因
  5. 因果の理解はAIのさらなる発展に必要 ◼Savage (2023) Why artificial intelligence needs to understand consequences,

    Nature • “機械” には、人間が生きていく中で自然に身につける「世界がどう動いているか」と いう常識的な理解が欠けている • 予測だけでなく制御をするには「何が原因で何が起きるか」を理解することが不可欠 ◼Zečević+(2023): “(少なくとも)現在のLLMは” 因果についてはオウム返し ◼識者の発言として紹介 • Judea Pearl (因果推論側) • AIの現状は因果の階層の「見る」段階にとどまり、 “介入”や“反実仮想”を扱えなければ深い理解には到達しない • 科学とは、世界に介入してその反応を見ることだ (MS Research Summit 2021) • Yoshua Bengio (機械学習側) • 因果モデルを持てばAIは環境変化やレア事象に強く、 人間のように想像し後悔できる 11
  6. 因果推論の次の課題 ◼因果グラフだけでなく“変数定義”も必要 • 介入に適切な粒度を推定 • マクロとミクロの対応 / Causal abstraction •

    圏論によるアプローチ (Otsuka & Saigo, 2025) ◼因果探索をアップグレード: 因果構造+変数定義の探索 Chalupka et al. (2017) 12
  7. 将来展望:「自律」因果探索へ ◼従来の課題 • 背景知識収集やそれに基づく変数定義、どのデータを使うか の判断は“手作業” ◼自律因果探索 (Autonomous Causal Discovery) •

    背景知識・データを自動統合 • 因果構造+変数定義という因果仮説を探索 • シミュレーション・自動実験等による検証で効率化とスケール拡大 ◼未来像:因果がわかるAIサイエンティスト • 人間との協働 • 医学・創薬・材料・社会科学など広く科学の発見や理解・産業応用を加速 13
  8. 生成AI × 因果探索 ◼Causal parrots (Zečević+2023) : オウム返し ◼LLMで背景知識を収集・データから因果推論 (Takayama+2025)

    リークのない (LLMが知らない) 健康診断データで評価 データが少ないと失敗 15 背景知識なし LLMによる背景知識あり