因果推論と機械学習

因果推論と機械学習清水昌平大阪大学・滋賀大学 JST CRDS 俯瞰ワークショップ機械学習と数学

AI for Scienceが盛り上がっている ◼科学の主目的は因果関係の解明 ◼AI for Scienceが描く研究サイクルに因果推論も必須 ◼現状: 多くは相関に関する分析 ◼相関+想像力より
因果推論に基づく実験・調査 2 https://www.mext.go.jp/content/20250826-ope_dev02-000044427_8.pdfより抜粋

「統計的」因果推論 (因果AI) ◼“通常”のAI: 相関に基づく予測 • チョコ消費量がこのくらいならノーベル賞の数はどのくらい？ ◼因果AI • チョコ消費量を増やすと
ノーベル賞の数は増える？ (介入効果) ◼無作為化実験によりデータを集めるのはしばしば困難 ◼それ以外の観察データを活用 3 Messerli, (2012), New England Journal of Medicine ノーベル賞受賞者の数相関係数: 0.79 チョコレート消費量

予測だけでなく制御するためには因果関係の理解が必要 ◼相関: 健康診断結果から将来の病気を予測 ◼因果: 体重を減らした場合にどう変わるかを知りたい 4 LDL ෣ 病気
血圧 . . . 機械学習による予測モデル体重 LDL ෣ 病気血圧 . . . 体重変化を調べるなら因果も考慮

因果推論の手順の典型例 (Pearl, 2001) 1. 背景知識を用いて因果構造を表すグラフを描く 2. どの変数を分析に含めるかを、数学的理論から導き、介入効果を推定 5 チョコ
賞 GDP 因果グラフ共通原因 Judea Pearl はチューリング賞（2011年）を受賞: それまで曖昧だった因果の概念を数学的に定式化し、因果推論の理論体系を確立した功績

因果推論のボトルネック？ ◼因果グラフを分析者が用意する必要がある • 特に未知の分野では因果グラフを描くだけの領域知識がないことは多い ◼因果探索: (一定の仮定の下)データ駆動で因果グラフを推測 • 因果推論をスケールさせる (規模・適用範囲)
6

因果探索 (Spirtes et al., 2001; 清水, 2017; Shimizu, 2022) ◼仮定+データ
→ 因果探索 → 因果グラフ Maeda and Shimizu (2020) 仮定(+背景知識) 推測 • 関数形 • 分布 • 未観測共通原因の有無 • 非巡回 or 巡回などデータ因果グラフ探索スペースを決めるデータと照らし合わせる残った候補 7 𝑦 = 𝑓 𝑥, 𝑢, 𝑒

因果探索の応用例1: 予防医学 (Okuda+2026, arXiv) ◼保健指導の健康アウトカムへの介入効果 ◼データの記録手順の情報を事前知識として因果探索 8 健康アウトカム服薬・生活習慣性別・年齢
保健指導

因果探索の応用例2: 材料科学 ◼機械学習による予測 + 因果探索 ◼なぜ予測に効くのか: 因果関係 or (因果でない)相関関係? •
因果経路 (メカニズム)・支配因子 9 記述子材料特性 ? 記述子材料特性 or 記述子材料特性 or 共通原因

因果探索の応用例3: 製造業異常検知だけでなく異常の原因も知りたい ◼機械学習による異常検知に加えて根本原因分析 ◼例: 異常指標に関する因果構造 (Fujiwara+2025) 10 異常指標根本原因

因果の理解はAIのさらなる発展に必要 ◼Savage (2023) Why artificial intelligence needs to understand consequences,
Nature • “機械” には、人間が生きていく中で自然に身につける「世界がどう動いているか」という常識的な理解が欠けている • 予測だけでなく制御をするには「何が原因で何が起きるか」を理解することが不可欠 ◼Zečević+(2023): “(少なくとも)現在のLLMは” 因果についてはオウム返し ◼識者の発言として紹介 • Judea Pearl (因果推論側) • AIの現状は因果の階層の「見る」段階にとどまり、 “介入”や“反実仮想”を扱えなければ深い理解には到達しない • 科学とは、世界に介入してその反応を見ることだ (MS Research Summit 2021) • Yoshua Bengio (機械学習側) • 因果モデルを持てばAIは環境変化やレア事象に強く、人間のように想像し後悔できる 11

因果推論の次の課題 ◼因果グラフだけでなく“変数定義”も必要 • 介入に適切な粒度を推定 • マクロとミクロの対応 / Causal abstraction •
圏論によるアプローチ (Otsuka & Saigo, 2025) ◼因果探索をアップグレード: 因果構造＋変数定義の探索 Chalupka et al. (2017) 12

将来展望:「自律」因果探索へ ◼従来の課題 • 背景知識収集やそれに基づく変数定義、どのデータを使うかの判断は“手作業” ◼自律因果探索 (Autonomous Causal Discovery) •
背景知識・データを自動統合 • 因果構造＋変数定義という因果仮説を探索 • シミュレーション・自動実験等による検証で効率化とスケール拡大 ◼未来像：因果がわかるAIサイエンティスト • 人間との協働 • 医学・創薬・材料・社会科学など広く科学の発見や理解・産業応用を加速 13

付録 14

生成AI × 因果探索 ◼Causal parrots (Zečević+2023) : オウム返し ◼LLMで背景知識を収集・データから因果推論 (Takayama+2025)
リークのない (LLMが知らない) 健康診断データで評価データが少ないと失敗 15 背景知識なし LLMによる背景知識あり

AIの説明性・公平性と反実仮想 ◼AIの予測を因果的に説明 • 例: 年収が100万円で、(AIによる)ローンの審査にAさんは落ちたが(事実)、もしもAさんの年収が500万円だったとしたら審査に通る確率は？(反事仮想) ◼企業の信用格付けデータ (Takahashi+2024) 16 信用
格付け資本金資本金因果的重要性

因果推論と機械学習

因果推論と機械学習

Shohei SHIMIZU

More Decks by Shohei SHIMIZU

Other Decks in Science

Featured

Transcript