Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CVPR2026論文紹介:Efficiently Reconstructing Dynamic...

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for hinako0123 hinako0123
June 20, 2026
46

CVPR2026論文紹介:Efficiently Reconstructing Dynamic Scenes One D4RT at a Time

Avatar for hinako0123

hinako0123

June 20, 2026

Transcript

  1. CVPR2026 Best paper award Efficiently Reconstructing Dynamic Scenes One D4RT

    at a Time 中京大学 工学研究科 工学専攻 博士2年 村上 尚生 名古屋CV・PRML勉強会 June 20, 2026 プロジェクトページ: https://d4rt-paper.github.io/
  2.  入力 1. RGB動画全体: Encoderでシーン全体の情報を持つ Global Scene Representation を生成 2.

    クエリ: どの点について知りたいかという情報  出力  指定した点が,指定した時刻・カメラ座標で3D空間のどこにあるかという座標情報 D4RT の全体像
  3.  「どの点を,どの時刻で,どのカメラ座標で見るか」を指定  𝒒𝒒 = (𝑢𝑢, 𝑣𝑣, 𝑡𝑡𝑠𝑠𝑠𝑠𝑠𝑠 , 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡

    , 𝑡𝑡𝑐𝑐𝑐𝑐𝑐𝑐 ) クエリ情報 𝒒𝒒 = (𝑢𝑢, 𝑣𝑣, 𝑡𝑡𝑠𝑠𝑠𝑠𝑠𝑠 , 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 , 𝑡𝑡𝑐𝑐𝑐𝑐𝑐𝑐 ) (𝑢𝑢, 𝑣𝑣) 画像上の点 𝑡𝑡𝑠𝑠𝑠𝑠𝑠𝑠 点を指定した元フレーム 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 知りたい時刻 𝑡𝑡𝒄𝒄𝒄𝒄𝒄𝒄 表現するカメラ座標  目的のタスクに応じてクエリの使い方を変更
  4.  エンコーダ  Per-Frame Self-Attention: 各フレーム内の情報を見る  Global Self-Attention: フレーム間の情報の関係を見る

     デコーダ  Cross-Attention: Query tokenとGlobal Scene Representationの関係 D4RT のモデル構造
  5.  クエリでは座標情報だけでなく局所的な見た目情報も利用  目的  点の局所的な見た目を与える  物体境界や細部の復元を改善  結果

     Depth推定,Camera Pose推定の両方で性能向上  特に物体境界がシャープになる アブレーション実験: Local RGB patchの効果