Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介 "ReSim: Reliable World Simulation for Auto...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Takuma Kogo
April 02, 2026
Research
100
0
Share
論文紹介 "ReSim: Reliable World Simulation for Autonomous Driving"
NeurIPS2025 spotlight論文
Takuma Kogo
April 02, 2026
Other Decks in Research
See All in Research
都市交通マスタープランとその後への期待@熊本商工会議所・熊本経済同友会
trafficbrain
0
180
はじまりの クエスチョンブック —余暇と豊かさにあふれた社会とは?
culturaltransition
PRO
0
280
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.6k
学習型データ構造:機械学習を内包する新しいデータ構造の設計と解析
matsui_528
6
4.5k
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.5k
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
150
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
16
23k
COFFEE-Japan PROJECT Impact Report(海ノ向こうコーヒー)
ontheslope
0
1.2k
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2k
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
350
台湾モデルに学ぶ詐欺広告対策:市民参加の必要性
dd2030
0
290
ScoreMatchingRiesz for Automatic Debiased Machine Learning and Policy Path Estimation with an Application to Japanese Monetary Policy Evaluation
masakat0
0
230
Featured
See All Featured
Side Projects
sachag
455
43k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
Practical Orchestrator
shlominoach
191
11k
Are puppies a ranking factor?
jonoalderson
1
3.2k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
170
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
220
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
500
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
710
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
210
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
85
Prompt Engineering for Job Search
mfonobong
0
250
Transcript
AI Community 2026.01.29 向後 卓磨 GOドライブ株式会社 論文紹介 ReSim: Reliable World
Simulation for Autonomous Driving
紹介する論文 大量の実データ 安全走行 少量のシミュレーションデータ 危険走行 ▪ “ReSim: Reliable World Simulation
for Autonomous Driving” [1] ▪ NeurIPS’25 Spotlight論文 ▪ 自動運転における世界モデルの一活用形態/学習方法を提案 学習 動画 予測 軌道計画を入力 衝突するような 軌道計画でも 妥当な映像を予測 従来手法 提案手法 十分に曲がってくれない
論文のスコープ ▪ タスク:環境認識(予測含む) + 局所の軌道計画 ▪ 前提 :自己位置と広域の経路計画が与えられている 自動運転のコンポーネント
先行研究:運転世界モデルによる動画予測 “Vista: A Generalizable Driving World Model with High Fidelity
and Versatile Controllability” (NeurIPS’24) [2] 学習フェーズ [1st] アクション入力なし 多量データ [2nd] アクション入力あり 少量データ→LoRA 予測フェーズ 1. 過去数フレーム+アクション → 次フレームを予測 2. 予測したフレームを入力に加えて自己回帰 → 5~15秒 (576x1024@10Hz) モデル:Stable Video Diffusion
課題:運転世界モデルにおける「安全性バイアス」 入力 予測結果 ↑ コースアウトせず道路に残留 ↓ 道路から右方へコースアウト 従来手法
提案手法 軌道計画 初期位置を原点 とした相対座標 ▪ 実運転データのほとんどは安全走行 → 危険走行シーンを予測できない ▪ 誤った予測結果を基に軌道計画がなされてしまう 走行道路から コースアウトする 軌道計画 Source: [1] Fig.5
提案手法 ▪ 動画予測:少量のシミュレーションデータを加えて運転世界モデルを学習 ▪ 軌道計画:シミュレーションデータで学習したVideo2Reward 運転動画から 運転の良し悪しを 推定するモデル Source: [1]
Fig.1
【動画予測】モデル 2B DiT (CogVideoX) 過去画像にも ノイズを加える ノイズレベル 時空間的 一貫性 高ノイズを1/2→2/3
に増やす 4M clips (w/o traj.) 85K samples (w/ traj.) 88K simulations VAE Source: [1] Fig.S11
【動画予測】損失関数 GTの動き 予測の動き 長期・短期での時空間的一貫性を保つ 大きい動きに過剰にFitすることを抑制→
【動画予測】学習 OpenDV Real カメラキャリブレーション無し 高レベルコマンド(例. 右折/直進)をOpenCV toolkitで pesude-labeling 曲がるシーンを5倍サンプリング NAVSIM
Real 軌道情報あり unScenes/Waymoデータを評価用に除外 CARLA Sim Bench2Driveで定義された走行経路から220をサンプル 2種類(安全/危険)のルールベースのエージェントで走行データを50:50で作成 ▪ 3-stageでの学習(GPU A100 x40台で14日間) Source: [1] Table S5
【動画予測】評価:忠実度 主観評価 (3つから好ましいものを選択) FID: Fréchet Inception Distance (画像の分布の近さ ) FVD:
Fréchet Video Distance (動画の動きの自然さ ) 映像上の自車両の軌道誤差推定値 Source: [1] Fig. 4, Table 1-2.
【動画予測】評価:制御性 入力 軌道計画毎の予測結果 Source: [1] Fig. 6
【動画予測】評価:失敗例 ▪ オクルージョンに対して、時系列的な一貫性を保つのが苦手(上段・中段) ▪ 極端なケースにおいてアーティファクトが発生(下段) Source: [1] Fig. S18
【軌道計画】動画報酬モデル backbone: DINOv2 ▪ シミュレータで計算した運転スコアを報酬値として学習したモデル ▪ 運転スコア減点対象:衝突、信号無視、路外逸脱、無意味な減速 軌道計画 1. 各Learned
Policyで軌道計画を算出 2. 各軌道計画毎に動画予測 3. 各予測動画に対して報酬値を算出 4. 最大報酬に対応するPolicyを選択 → その軌道計画を採用する (※ Learned Policy は既存のもの) Source: [1] Fig. 2
【軌道計画】評価:Policy選択 Policy単体 Policy選択 アンサンブル ▪ シミュレータNAVSIM上で運転スコアを評価 ▪ 走行シナリオ:挑戦的な300ケース (Transfuser/LTFのいずれが上手くいかないケース) ▪
評価指標 :運転スコアPDMS (Predictive Drive Model Score) Source: [1] Table 3.
【軌道計画】評価:既存E2Eアプローチとの比較 ▪ シミュレータNAVSIM上で運転スコアを評価 ▪ 走行シナリオ:NAVSIM navtest ▪ 評価指標 :運転スコアPDMS Source: [1]
Table 4.
▪ 少量の危険走行シミュレーションデータを学習データに加えることで 運転世界モデルの動画予測の性能を改善 ▪ 忠実度 ▪ 軌道計画に対する制御性 ▪ シミュレーションデータで学習した動画報酬モデルと動画予測を組み 合わせることで、良好な軌道計画を選択
▪ 拡散モデルの推論の計算負荷が高く、実用に課題あり まとめ
[1] J. Yang, et al., “ReSim: Reliable World Simulation for
Autonomous Driving” , NeurIPS, 2025. [2] S. Gao, et al., “Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability”, NeurIPS, 2024. 参考文献