Upgrade to Pro — share decks privately, control downloads, hide ads and more …

応用空間統計ワークショップ@統数研(2025/1/8)

koh_t
January 07, 2025
430

 応用空間統計ワークショップ@統数研(2025/1/8)

応用空間統計ワークショップ@統数研(2025/1/8)で発表したスライドです

koh_t

January 07, 2025
Tweet

Transcript

  1. 竹内 孝 たけうち こう 京都大学大学院情報学研究科 知能情報学・データ科学コース 講師 【経歴】 2011-2020 日本電信電話株式会社

    CS研 研究員 2016-2019 京都大学 博士後期課程 博士(情報学) 2020-2023 京都大学 助教 2023-現在 現職(鹿島・竹内研究室) 【専門分野】 機械学習、データマイニング、時空間データ 【その他・悩み】 研究室の学生が増えすぎて座席が足りない 渋滞長を 予測 信 号 制 御 交通管制セン タ ー カ ーナビ ・ 地図アプリ 経 路 誘 導 東京都の渋滞予測で一発屋 (十年の計を遂に実現) 1
  2. 都市や地域で計測される情報を解析の実現 2 1. 時空間と意思決定の統合 データ解析手法の体系化 2. 時空間基盤モデルの開発 京都大学 竹内チーム 時空間基盤モデルの実現と社会実装

    共同研究先の 研究・開発機関 (チーム構築) 技術展開 課題展開 A. 時空間と意思決定の情報を統一的に扱う方法論と技術の体系化 B. 体系化した技術に基づく時空間基盤モデルを社会で実運用 1. 都市や組織間でのデータ流通と利活用を促進 2. 多様な意思決定を補助し、社会の安心安全なAI運用に貢献 3. 共同研究先と協力した社会実装により、社会インパクトを発生 (他大学へ展開予定)
  3. Travel Demand Prediction with Application to Commuter Demand Estimation on

    Urban Railways Yohei Kodama, Yuki Akeyama, Yusuke Miyazaki, and Koh Takeuchi. In Companion Proceedings of the ACM Web Conference 2024 (WWW '24). 4 元新幹線運転手のデータサイ エンティストさんが主著!
  4. 商圏分析における新駅設置の影響予測 どこに住んでる人はどの駅を使う? • 駅の開設前のデータから、駅開設後の需要を予測したい • 需要を最大化する地点の選択、需要に合わせた駅の設計に活用 5 Yohei Kodama, Yuki

    Akeyama, Yusuke Miyazaki, and Koh Takeuchi. 2024. Travel Demand Prediction with Application to Commuter Demand Estimation on Urban Railways. In Companion Proceedings of the ACM Web Conference 2024 (WWW '24). 開設前の郵便番号ごとの定期登録数最大駅の分布 開設1年後の郵便番号ごとの定期登録数最大駅の分布
  5. 商圏分析における新駅設置の影響予測 どこに住んでる人はどの駅を使う? • 鉄道会社では距離に基づくボロノイ図が長年使用されている • しかし、現実の駅の選択のパターンとは乖離が生じる 6 郵便番号ごとの定期登録数最大駅の分布 現実の選択と 合わない

    Yohei Kodama, Yuki Akeyama, Yusuke Miyazaki, and Koh Takeuchi. 2024. Travel Demand Prediction with Application to Commuter Demand Estimation on Urban Railways. In Companion Proceedings of the ACM Web Conference 2024 (WWW '24). 伝統的なモデル(ボロノイ図) 駅の選択は地点と駅の距離 に従うと仮定
  6. 郵便番号から鉄道駅を利用する人数を 回帰する問題に帰着 • 郵便番号と駅の空間情報から利用者数を回帰する手法を提案 • JR西日本の4新駅のIC交通カードデータの実験から性能改善を確認 7 郵便番号と駅の空間情報から 教師あり学習で予測 Yohei

    Kodama, Yuki Akeyama, Yusuke Miyazaki, and Koh Takeuchi. 2024. Travel Demand Prediction with Application to Commuter Demand Estimation on Urban Railways. In Companion Proceedings of the ACM Web Conference 2024 (WWW '24).
  7. QTNet: Theory-based Queue Length Prediction for Urban Traffic Ryu Shirakami,

    Toshiya Kitahara, Koh Takeuchi, and Hisashi Kashima. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23). 8
  8. 渋滞フリーでスムーズな交通に向けた取り組み 11 ◦現代の渋滞対策 ① 交通状態をモニタリングする ② 渋滞の発生を確認する ③ 渋滞を解消するよう対処する 信号の長さを調整する

    →混雑している道路の流れを増やす 空いている経路へ誘導する →混雑している道路の車を減らす ◦AIを用いた未来の渋滞対策 ① AIで交通ビッグデータを解析する ② AIで渋滞の発生を予測する ③ 渋滞を予防する 信号の長さを先に調整する 空いている経路へ先に誘導する 渋滞予測AIの実用化を阻む問題 ・渋滞には多要因が絡むので高精度化が困難 ・AIの解釈性と信頼性が低いと実用化できない いつ・どこで 何メートル? 交通データを 蓄積中 交通管制センター Ryu Shirakami, Toshiya Kitahara, Koh Takeuchi, and Hisashi Kashima. 2023. QTNet: Theory-based Queue Length Prediction for Urban Traffic. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23).
  9. 深層学習と交通理論に基づく新たなアイディア 12 渋滞長、速度、交通量を統合解析する →時間的依存から渋滞兆候を早期発見する 道路網の構造情報を入力する →交通の地理空間的な関係を反映する 長さ 解釈可能性 時間 場所

    AIで交通データの時間・空間的に複 雑なパターンを学習できるか? ② 実用化に向けた解釈性担保 ① 渋滞予測の精度改善 入力 地理的に 妥当な予測 東京の道路網 →時空間グラフニューラルネットワーク (1STGNN)を活用し精度を改善する AIの渋滞長の予測は解釈しにくい 交通の知識と大きく乖離することも (1) Spatio-Temporal Graph Neural Network (STGNN) (2) S. Takaba et al., Estimation and measurement of travel time by vehicle detectors and license plate readers. In Vehicle Navigation and Information Systems Conference, 1991, Vol. 2. 257–267. →交通理論とAIを融合し、渋滞予測の解 釈性と精度を改善する 交通工学の2数理モデルを活用する →交通工学の型に合わせることで、 予測の頑健性を向上させる →解釈不可能な予測を除外する (渋滞長500mだが速度80km/hなど)
  10. 最先端の深層学習と交通理論を組み合わせた 時空間AI技術(QTNN)による渋滞予測を提案 13 ①深層学習(STGNN)が交通/道路網データから パターンを学習し、現在までの交通データから 今後の速度と交通量を予測 ② QT-layerが交通流モデルを 活用・補正しつつ①の予測値か ら今後の渋滞長を予測

    QTNNの模式図 理論とデータのギャップを補正 速度 交通量 渋滞長 STGNN 交通量 速度 補正項 エンコーダ デコーダ 周期的/静的交通特徴量 道路網構造 ① ② ・渋滞長の精緻な予測を実現 ・予測の解釈が可能に ①②組み合わせて ・過去の計測値(青) ・未来の予測値(緑) 渋滞長 QT-Layer 交通理論ベースの処理層で、 渋滞長は「砂時計モデル」から出力される Ryu Shirakami, Toshiya Kitahara, Koh Takeuchi, and Hisashi Kashima. 2023. QTNet: Theory-based Queue Length Prediction for Urban Traffic. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23). 警視庁交通管制センターから提供された東京の実際のデータで解析
  11. 東京都1098箇所の一般道における「1時間先の渋滞 長を予測する実験」で、平均誤差40m以下を達成 14 東京都の構造改革の取り組み「シン・トセイ」において、警視庁による「AI とビッグデータを活用した交通管制 システムの高度化プロジェクト」が進められています 渋滞長m] 時刻 渋滞長[m] 実際の観測値

    予測値 予測結果の解釈も可能 交通量が急激に増加するため、大きな渋滞の発生する可能性がある 予測誤差を40m以下に低減 ① QTNNは最先端のAIと比べて1時間 先の誤差を12.6%改善しました 12.6% 最先端の深層学習技術:DCRNN, ARGCN, GWNT, MegaCRN ② 変数間の挙動に矛盾がないため、渋 滞長を交通状況から説明可能 LLMと比較して軽量なモデルで GPU1枚で学習と推論が可能 Ryu Shirakami, Toshiya Kitahara, Koh Takeuchi, and Hisashi Kashima. 2023. QTNet: Theory-based Queue Length Prediction for Urban Traffic. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23).
  12. 実環境での本格的な運用に向けて、一部の道路にお いて評価試験を実施し、信頼性の検証を進める予定 15 ◦本成果のITS(高度交通システム)に おける活用イメージを情報発信 ◦報道多数、外部評価も獲得 報道17件 :日経新聞、電気新聞、 科学新聞、 日刊自

    動車新聞、客观日本 、Science Japanなど 子供の科学 2023年11月号 イラストデザイン:津田 祐果(UMA / design farm)、イラストレーター:米村 知倫 日経新聞 2023/12/27 朝 刊 外部評価:総務省 2023年度 異能ジェネレーションア ワード、科学技術振興機構 2024年度 事業成果 (1) https://www.jst.go.jp/seika/bt2024-02.html 科学技術振興機構 2024年度 1)事業成果
  13. 空間の情報はグラフによって柔軟に表現できる • グラフはノード、エッジ、頂点特徴量で表現されるデータとする 17 道路網 = (交差点, 道路, 混雑度) https://www.mlit.go.jp/hakusyo/mlit/r01/hakusho/r02/html/n2611000.html

    https://www.tokyometro.jp/library_in/en/subwaymap/pdf/rosen_en_1803.pdf https://www-nature-com.kyoto-u.idm.oclc.org/articles/s41586-019-1352-7 鉄道網 = (駅, 線路 , 利用客数) 線虫 = (神経細胞, シナプス, 発火数)
  14. グラフニューラルネット (Graph Neural Networks: GNN) による空間データ解析 • GNNはグラフから特徴量を抽出する技術 • ノード分類、エッジ予測、グラフ毎の予測などに使用可能

    18 空間グラフ = (座標, 距離, 座標特徴量) 𝐺 = 𝑉, 𝐸, 𝑿 𝑉 = 𝑁, 𝑿 ∈ 𝑅𝑁×𝑑 隣接行列 𝑨 ∈ 𝑅𝑁×𝑁 特徴量 𝑯 ∈ 𝑅𝑁×𝑑’ GNN 1 2 3 4 1 2 3 4 空間分布の傾向が抽出される
  15. グラフニューラルネット(GNN)はグラフを解析するための 強力なツール • GNNはグラフから特徴量を抽出する技術の1つ • 周辺の頂点の情報を集約することで空間的な傾向が見える 19 1 2 3

    4 1 2 3 4 空間グラフ = (座標, 距離, 座標特徴量) 𝐺 = 𝑉, 𝐸, 𝑿 𝑉 = 𝑁, 𝑿 ∈ 𝑅𝑁×𝑑 隣接行列 𝑨 ∈ 𝑅𝑁×𝑁 特徴量 𝑯 ∈ 𝑅𝑁×𝑑’ GNN
  16. グラフニューラルネットワークは、グラフ上で離れた頂点間 の情報が伝搬し、特徴量を抽出する • GNN: 𝑯 = 𝑓 𝑊 (𝑿,𝑨)の演算は3ステップから構成 •

    ①頂点特徴量の変換、②メッセージの抽出、 ③メッセージの集約 • 上記の演算を繰返し、グラフ構造を反映した特徴量を抽出 20 1 2 3 4 1 2 3 4 1 2 3 4 ①頂点特徴量の変換 ③メッセージの集約 ②メッセージの抽出
  17. 時空間グラフニューラルネット (Spatio-temporal Graph Neural Networks: STGNN) • 頂点特徴量が時系列データである場合に特化したGNN • 空間的な特徴量をGNNで抽出

    • 時間的な特徴量をCNNやRNNやTransformerで抽出 • 上記の操作を繰り返し、時空間的な特徴量を抽出 21 Weiwei Jiang, Jiayun Luo, “Graph neural network for traffic forecasting: A survey”, Expert Systems with Applications, Vol. 207, 空間的な特徴量 1 2 3 4 1 2 3 4 時間的な特徴量 1 2 3 4
  18. ノード埋め込みの学習を取り入れたSTGNN Graph WaveNet • 事前に構築したグラフは、データの構造と適合しない場合がある • データからグラフの構造を学習してしまう → ノード埋め込み学習 22

    Zonghan Wu et al. "Graph WaveNet for Deep Spatial-Temporal Graph Modeling,” In Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI), 2019. Lei Bai et al. “Adaptive Graph Convolutional Recurrent Network for Traffic Forecasting,” In Proceediongs of NeurIPS, 2020. 1 2 3 4 1 2 3 4 データに合う グラフを学習 GWNet
  19. 大規模な軌跡データから移動の特徴を抽出する技術 • 軌跡の形状やダイナミクスの情報を抽出し、GPSと時刻のみの情報から「渡 り鳥はオスかメスか」などの分類高精度化に成功した 25 2つの軌跡の差異を抽出する 渡り鳥※1,2の飛行軌跡データ 鳥の性別など ※1 オオミズナギドリ

    ※2 発表者は計測現場を実際に確認するため新潟県粟島(離島)まで同行した 赤:オスの移動軌跡 青:メスの移動軌跡 Fréchetカーネル Koh Takeuchi, Masaaki Imaizumi, Shunsuke Kanda, Yasuo Tabei, Keisuke Fujii, Ken Yoda, Masakazu Ishihata, Takuya Maekawa. Fréchet Kernel for Trajectory Data Analysis, Proceedings of the 29th International Conference on Advances in Geographic Information Systems (SIGSPATIAL), pp. 221-22, 2021.
  20. 群衆移動誘導における介入効果推定 • 群衆の位置 X から避難誘導 Z による避難時間Yを予測する問題 • 空間特徴量をCNNで抽出し、介入効果推定する手法を提案 •

    新国立劇場の避難シミュレータから生成したデータを用いた実験から介入効果推定 の精度向上を確認 26 劇場からの避難誘導の有無とドアの開閉選択 を介入とし2^7通りの組み合せの介入を想定 新国立劇場大ホールのシミュレーション例 ①共変量から空間特徴量を抽出 ②ドメイン適応法により 介入選択バイアスを除去 ③空間特徴量と 介入から結果を予測 Spatial Convolutional Counter Factual Regression Koh Takeuchi, Ryo Nishida, Hisashi Kashima, Masaki Onishi. ” Grab the reins of crowds: Estimating the effects of crowd movement guidance using causal inference. ” Proceedings of the 20th International Conference on Autonomous Agents and MultiAgent Systems (AAMAS), 2021.
  21. 移動体へ逐次的に介入する場合での介入効果推定 • 周囲に存在する他の移動体や障害物との相互関係をモデリング • シミュレータから自動運転車の操舵、スポーツにおける指示などのデータを作 成し介入効果推定の評価を行い性能改善を確認 27 Keisuke Fujii, Koh

    Takeuchi, Atsushi Kuribayashi, Naoya Takeishi, Yoshinobu Kawahara, Kazuya Takeda. “Estimating counterfactual treatment outcomes over time in multi-vehicle simulation,” In Proceedings of the 30th International Conference on Advances in Geographic Information Systems (SIGSPATIAL), 2022.
  22. Causal Effect Estimation on Hierarchical Spatial Graph Data Koh Takeuchi,

    Ryo Nishida, Hisashi Kashima, and Masaki Onishi. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23). 28
  23. データと理論の関係は難しいですね 31 • ティコの調査は当時最良の観測より も5倍ほど正確 • 膨大な天体観測記録を残し、 ケプラーの法則を産む基礎を構築。 ティコ・プラーエ (Tycho

    Brahe, 1546-1601) ガリレオ・ガリレイ (Galileo Galilei, 1564-1642) • 望遠鏡を用いた惑星の観察による 地動説の証拠 • 物体の落下運動の法則、 慣性の法則等の力学の基礎 ヨハネス・ケプラー (Johannes Kepler、1571 - 1630) 第5章 運動を解明した人々: コペルニクス・ケプラー・ガリレイ https://www2.yukawa.kyotou.ac.jp/~takehiro.azuma/kagakugijutsu_azuma_slide.pdf • 惑星の運動に関するケプラーの3法則 • ティコ・ブラーエの観測データを元に 惑星軌道の正確な決定を目指す。 「初めて、正確な経験的事実を切なる情熱を持って追い 求めるという、現代天文学にかなう精神を持った人」
  24. AI予測の不確実性に由来する 社会実装後のワーストケースをどう防ぐか? • 数理モデルやAIによる予測と予報が社会活動に大きな影響を与える • 例:南海トラフ地震臨時情報、台風の進路予測など • 予測には常に不確実性が伴う(確率モデルだから、それはそう) • 社会実装後はAI予測に基づく意思決定には大きな責任が伴う

    33 南海トラフ地震臨時情報 まもなく1か月 課題踏まえどう対応?: 「あいまいな情報をもとにどう被害を減らすか、正解の無い答えを 探している。国民全体が当事者となって一緒に解決策を考えるのが望ましい。」「これらのデータに基づいて南海トラフ地震を予 知するには、克服すべき課題が多い。将来、予知できるよう、今の世代が観測データを蓄積する必要がある。」
  25. 因果推論を用いた介入効果推定 意思決定を介入として扱ってみる • 入力 (共変量)、介入、出力(結果)からなるデータセットを仮定 • 介入は条件付分布 π(入力) から得られると仮定 •

    入力が与えられた時の介入の有無による差の期待値は? 36 条件付き平均介入効果 (Conditional Average Treatment Effect: CATE) 介入した 介入しない 潜在的な出力 (Potential outcome) 平均介入効果 (Average Treatment Effect: ATE)
  26. 機械学習をプラグインした介入効果推定 • 条件付分布 π(x i )や出力の推定値 f(x i , a

    i )のモデルに機械学習(というか 深層学習)を用いて高精度化する手法が多数提案(大雑把には) 38 Alicia Curth and Mihaela van der Schaar, Nonparametric Estimation of Heterogeneous Treatment Effects: From Theory to Learning Algorithms. In Proceedings of the 24th International Conference on Artificial Intelligence and Statistics (AISTATS), 2021
  27. 空間上の因果効果を推定する Spatial Intervention Neural Network (SINet) • 空間情報を扱うNNと因果推論を組み合わせ、空間上の介入の因果効果推 定を推定するモデルを提案 •

    データ駆動型モデルであるため、大量のデータからの学習が可能 • 深層学習による柔軟なモデリングが可能 41 空間GNN 因果推論 空間介入 Neural Network Koh Takeuchi, Ryo Nishida, Hisashi Kashima, and Masaki Onishi. 2023. Causal Effect Estimation on Hierarchical Spatial Graph Data. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23).
  28. What-if分析をサポートする時空間因果推論の研究 • 意思決定による結果の変化を予測するモデルを開発した • 因果推論※1の介入(選択可能な変数)として意思決定を扱う 仮定1. サンプル毎に意思決定が実行され、対応する結果のみが観測される(反事実欠損) 仮定2. 意思決定はポリシーに従い、過去の意思決定には偏りが存在する(介入選択バイアス) 42

    ※1 共変量Xの条件付き分布から介入Zが選択され、結果Yが観測される、 因果推論におけるポテンシャルアウトカムのフレームワークに基づいている 時空間因果推論モデル 共変量 X どこにいる? 介入 A どこで誘導? 空間情報 G どんな場所? 結果 Y 皆さんが避難するまで N分かかりました
  29. 技術課題と解決法 1. 共変量と介入の空間的影響の活用→階層的空間グラフの畳み込み 2. 反事実欠損と選択バイアスへの対処→HSICによる表現学習 3. 単調増加する時系列の予測→累積分布間の差異を評価する損失 43 ※1 共変量Xの条件付き分布から介入Zが選択され、結果Yが観測される、

    因果推論におけるポテンシャルアウトカムのフレームワークに基づいている 時空間因果推論モデル 共変量 X どこにいる? 介入 A どこで誘導? 空間情報 G どんな場所? 結果 Y 皆さんが避難するまで N分かかりました
  30. 階層的な空間グラフ畳み込みモデル • ローカルなGNNグラフから潜在特徴量Zを抽出 • グローバルなGNNから介入を考慮した潜在特徴量Z‘を抽出 • 単調増加する時系列データYを出力 45 Koh Takeuchi,

    Ryo Nishida, Hisashi Kashima, Masaki Onishi. ” Causal Effect Estimation on Hierarchical Spatial Graph Data. ” In Proceedings of the 29th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD), 2023. Spatial Intervention Neural Networks (SINet)
  31. 1.共変量と介入の空間的影響の活用 • 介入を行うM個の座標と介入の有無を表現する座標特徴量Zを定める • 共変量と介入からなる空間グラフをGとする 𝐺 = 𝑉, 𝐸, 𝑋′

    𝑉 = 𝑁 + 𝑀, 𝑋′ = 𝑋; 𝑍 , 𝑋 ∈ 𝑅𝑁×𝑑, 𝑍 ∈ 𝑅𝑀×𝑑 • N+Mが大きい場合、GNNでは共変量と介入の干渉が抽出困難 • 共変量と介入が遠く離れているため、多数回のグラフ畳み込みが必要 • GNNは畳み込みを繰り返すと特徴量が過平滑化され空間的な特徴が喪失 46
  32. 2. 反事実欠損と選択バイアスへの対処 • 介入効果推定を行うためには以下が必要 [Sharit 16] • 反事実欠損の推定 • 介入の選択バイアスの除去バイアス

    • 「共変量の潜在変数Zの分布」と「介入の埋め込みベクトルUの分布」が独 立になるようHSICで正則化して表現学習 • PEHEの推定誤差の上限になるため、介入効果が推定可能 48 HSIC =Ε𝑍,𝑍′,𝑈,𝑈′ 𝑘 𝑍, 𝑍′ 𝑙 𝑈, 𝑈′ + Ε𝑍,𝑍′ 𝑘 𝑍, 𝑍′ Ε𝑈,𝑈′ 𝑙 𝑈, 𝑈′ - Ε𝑍,𝑈 [Ε𝑍′ [𝑘 𝑍, 𝑍′ ]Ε𝑈′ [𝑙(𝑈, 𝑈′)]]
  33. 3. 単調増加する時系列の予測: 目的変数は時刻毎の避難完了者数 • 予測値は時刻毎に単調増加する分布とみなせる • 2つの累積分布関数F, F’の差異を評価する損失を新たに提案 49 The

    Cramér-von Mises criteria The Kolmogorov–Smirnov criteria Smooth Max関数で一般化した損失関数を提案 ・α→∞のとき The Cramér-von Mises criteria ・α→0のとき The Kolmogorov–Smirnov criteria
  34. 大規模な避難シミュレーションデータを用いた 介入効果推定実験 • 新国立劇場における6個のフロア、9個の介入エリアからの避難シミュレーシ ョンから、時刻毎の避難完了者数の時系列データを作成 • 提案手法により介入効果を推定する問題での性能改善を確認 51 Koh Takeuchi,

    Ryo Nishida, Hisashi Kashima, Masaki Onishi. ” Causal Effect Estimation on Hierarchical Spatial Graph Data. ” In Proceedings of the 29th ACM SIGKDD International Conference on Knowledge 新国立劇場のマップ 時刻毎の避難完了者数の時系列データ
  35. 新国立劇場で避難訓練を行った研究チームの構築し た避難シミュレータを使用してデータ生成 52 避難シミュレータの例 山下 倫央, 野田 五十樹, 荻野 光司,

    高田 和幸, 大原 美保, 歩行者シミュレーションを用いた二段階避難による混雑軽減の分析, 人工知能学会 論文誌, 2016, 31 巻, 6 号, p. AG-I_1-10, 2017 北九州芸術劇場で570人が参加した実働避難訓練でシミュレータのパラメータは調整 済み。全員の避難時間の実測とシミュレーションの誤差は5%以下。 経路誘導無しの場合 経路誘導有りの場合
  36. 介入効果推定の性能評価を行う時空間データの作り方 • 介入効果推定の性能評価には、全ての介入選択に対応するデータ、あるいは ランダムに介入が選択されたデータが必要 • 倫理・経済的な問題から条件を満たす時空間データは観測不可能 • シミュレータにより全介入に対応する結果を作成する手段を取った 54 介入

    Z 共変量 X ①乱数から大量に生成 ? 結果 Y ③シミュレータから生成 ②全組み合せを選択 ④意思決定のポリシーp(Z|X)を定め、 訓練用の観察データDを作成する ⑤ D から時空間モデルfを学習し、 テスト用の全介入に対応するデータ の予測性能を評価 いかに時空間的な関係を捉えつつ、 ポリシー由来の介入選択バイアスを 除去し、全ての反事実を予測するモデルを作れるか?
  37. 実験設定 • 新国立劇場の最大収容人数 3210 人までの避難を想定 • フロア毎の収容率を30%, 60%, 90% から選択し、エージェントを座席にラ

    ンダムに配置し、全介入パターンでシミュレート • 方策から観察データを作成し訓練、未知のデータの全介入パターンに対する 予測を評価 55 Model Train Data Test within Data Test without Data
  38. 定量評価: 階層的な空間グラフデータからの介入効果推定 • 最新のSTGNN (DCRNN, ARGCN, GWNet)と比較して 大幅な予測誤差の改善が確認された 56 Koh

    Takeuchi, Ryo Nishida, Hisashi Kashima, Masaki Onishi. ” Causal Effect Estimation on Hierarchical Spatial Graph Data. ” In Proceedings of the 29th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD), 2023. 反事実への予測誤差 介入効果の推定誤差 教師あり 学習 NN、 CFR STGNN