EmerNerf: 自己教師あり学習による3次元空間認識

EmerNerf 自己教師あり学習による3次元空間認識 ICLR2024 論文紹介 Turing(株) 棚橋耕太郎 EMERGENT SPATIAL-TEMPORAL SCENE
DECOMPOSITION VIA SELF-SUPERVISION

従来の自動運転システム機能ごとに分かれたモジュールが独立に動くので全体最適化ができない画像 LiDAR点群 HDマップ Perception • 物体認識 •
標識認識 • レーン認識 Prediction • 移動予測 • 将来マップ予測 • 交通エージェント Planning • 探索問題 • 経路計画 Control • 制御アルゴリズム https://paperswithcode.com/dataset/nuscenes prediction perception planning

End-to-end 自動運転AI マルチカメラ画像 Neural Network 車の経路 End-to-endモデルを構築し画像から車の経路を直接出力する画像 LiDAR点群 HDマップ
Perception • 物体認識 • 標識認識 • レーン認識 Prediction • 移動予測 • 将来マップ予測 • 交通エージェント Planning • 探索問題 • 経路計画 Control • 制御アルゴリズム従来のシステム

E2Eにおけるサブタスクマルチカメラ画像車の経路 NNに様々なサブタスクを課すことで、 E2E自動運転に必要な強力な特徴を手にいれることができる Occupancy Prediction Map Prediction 画像:
Tesla AI Day 2022より

Occupancy Prediction https://github.com/CVPR2023-3D-Occupancy-Pre diction/CVPR2023-3D-Occupancy-Prediction 画像: https://arxiv.org/pdf/2306.02851 Good: 3次元認識が可能(lidarの代替) Bad: Voxelの教師ラベルが必要
空間上のvoxelラベルを予測する問題

EmerNerf Nerfベースの自己教師あり学習により動的・静的物体を分離して3次元空間の学習が可能動的・静的・flowフィールドの分離 Occupancyの構築

運転映像を扱う難しさ通常のNerfと異なり、方向が固定されたカメラからの画像を扱うので画像がスパースになる通常のNerfの入力様々な角度からの画像車載カメラで撮影する画像

D2Nerf 自己教師あり学習により動的・静的物体を分離する方法を提案動的・静的・flowフィールドの分離時間依存するフィールドと時間非依存なフィールドでcolor consistency lossを構築静的フィールド(時間依存なし) 動的フィールド(時間依存あり) 空間が動的or静的物体のどちらかで占有されるという制約を表すロス
https://arxiv.org/pdf/2205.15838

EmerNerfの全体像動的物体、静的物体、空、 flowに分解して考える学習可能なHash関数を使って特徴量 gと密度σを構築動的物体、静的物体、空、影に対して MLP Headで色を予測静的物体と動的物体の重付き和で (x,t)に対する色を出力
画像上のピクセルの色をレンダリングするシーン表現

EmerNerfの全体像動的物体、静的物体、空、 flowに分解して考える前向きflow v_fと後ろ向きフローv_bの予測を行う Flow予測 t=t-1とt=t+1の特徴の重み付き和をとってflowの整合性を保証する

Novel View Synthesis

DINOv2特徴量の3次元lift 特徴量用のMLPを用いて、f*とf_skyを構築レンダリング計算により、画像上の featureを予測し、これが画像上のDINOv2特徴量と一致するように学習する DINOのPosition Encodingが邪魔になるので、それを取り除く項を導入

DINO特徴量の3次元lift 3D空間上にDINO特徴量を埋め込むことが可能→オートラベリングに有用

Nerfはもう古い？ https://pkuvdig.github.io/DrivingGaussian/

まとめ • EmerNerfは自己教師あり学習とﬂow予測により動的物体を自然にNerf に取り入れ、新規視点生成タスクでSOTAスコア • D2Nerfに対してHash関数やlidar点群を利用できるようにし、広い空間に対して適用できるようにした • DINO特徴量を3次元空間上にliftする方法を提案（Position Encoding
の効果を削除） →オートラベリングなどに有用

EmerNerf: 自己教師あり学習による3次元空間認識

EmerNerf: 自己教師あり学習による3次元空間認識

kotaro_tanahashi

More Decks by kotaro_tanahashi

Featured

Transcript