Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[Journal club] FreeTimeGS: Free Gaussian Primit...

[Journal club] FreeTimeGS: Free Gaussian Primitives at Anytime and Anywhere for Dynamic Scene Reconstruction

More Decks by Semantic Machine Intelligence Lab., Keio Univ.

Other Decks in Technology

Transcript

  1. FreeTimeGS: Free Gaussian Primitives at Anytime and Anywhere for Dynamic

    Scene Reconstruction Yifan Wang1, Peishan Yang1, Zhen Xu1, Jiaming Sun1, Zhanhua Zhang2, Yong Chen2, Hujun Bao1, Sida peng1, Xiaowei Zhou1 1Zhejiang University, 2Geely Automobile Research Institute CVPR2025 慶應矩塟倧孊 杉浊孔明研究宀 朚暮緋南 Yifan Wnag, et al. "FreeTimeGS: Free Gaussian Primi9ves at Any9me and Anywhere for Dynamic Scene Reconstruc9on" CVPR 2025. 01
  2. 抂芁 u背景 • レンダリング効率ず品質の䞡立が困難 • 高速・耇雑な運動を扱えない u提案手法 • ガりシアンの䜍眮を単玔な等速盎線運動で衚珟 •

    4D正則化損倱、 呚期的再配眮で安定した最適化ず高品質なレンダリングを 実珟 u結果 • Neural3DV、 ENeRF-Outdoorおよび自䜜デヌタセットにおいお、 既存手法を䞊回った 02
  3. 背景レンダリング速床ず品質の䞡立が課題 uNeRFベヌス • MLPを甚いお時間ごずの色や密床を予枬 • 🙅蚈算コストが非垞に高い • 🙅レンダリングが遅い u Gaussianベヌス

    • 3DGSを動的シヌンに拡匵 • 時間軞での倉化をも぀ガりスを導入 • 🙅NeRFベヌスよりもレンダリングは速いが、品質が䞍十分 • 🙅䜍眮ず速床を同時に孊習する必芁があるため、最適化が䞍安定になる • 🙅耇雑な運動に匱い どちらも実甚的に䞍十分 03 Neural3DV [Li+, CVPR22]
  4. 関連研究既存手法では耇雑な動きを捉えられない ベヌス 手法 抂芁 問題点 NeRF HyperReel [Attal+, CVPR23] カメラ芖点や時刻に応じおサンプルを遞択

    🙅レンダリング速床が遅い 🙅ストレヌゞ・リ゜ヌス芁求が倧きい 🙅動的・耇雑な運動を远えない NeRFPlayer [Song+, TVCG23] 衚珟を圧瞮・分割しお順次読み蟌む Gaussian 4DGS [Yang+, 23] 各Gaussianに「空間 + 時間」の䜍眮ず 運動パラメヌタを持たせる 🙅高速運動で䞍安定 🙅モデルサむズが倧きい STGS [Li+, CVPR23] 各Gaussianに倚項匏+各速床を割り圓お 運動をモデル化 🙅パラメヌタが倚い 🙅耇雑運動で過孊習・最適化が困難 4DGS HyperReel 04
  5. 提案手法(2/5)パラメヌタ u 各ガりシアンが持぀パラメヌタ • : 䜍眮、ガりス空間䞊の䞭心座暙 • : 時間、そのガりスがもっずも匷く寄䞎する時刻 •

    : 持続時間、そのガりスが寄䞎する時間の長さ • : 速床、時間ずずもに移動する向きず速さ • : スケヌル、ガりスの広がり方 • : 向き、ガりスの楕円䜓がどの方向に䌞びおいるかを決める回転行列 • : 䞍透明床、ガりスの濃さを決める倀 • : 球面調和係数(SH係数)、ガりスが攟぀色を方向䟝存で衚す係数 「どこにある」「い぀存圚する」「どの方向に動く」「どのくらいの時間 有効である」「どんな色を攟぀」のかが定矩可胜 06
  6. 提案手法(3/5)䜍眮の時間倉化 u 䜍眮の基本匏 • 各ガりシアンは等速盎線運動をするず仮定 u 等速盎線運動 • 既存手法は「角速床」や「倚項匏」で動きを衚珟 •

    🙅耇雑すぎお最適化が䞍安定 • 🙅速い動きだず収束しにくい • 単玔な等速盎線運動を採甚 • 🙆近距離の動きだけを孊習すれば良い • 🙆速床のみ最適化すれば良い • 🙆蚈算が安定、局所解にはたりにくい 耇雑な曲線を、小刻みな盎線運動を積み重ねるこずで衚珟 07
  7. 提案手法(4/5)色の蚈算 u色の蚈算匏 • : 孊習されるSH係数 • : 球面調和関数 • :

    時刻tにおけるカメラから芋たガりス䞭心ぞの方向ベクトル • : 球面調和展開の次数(倧きいほど衚珟力↑) 時間で移動した䜍眮を参照しおいるため、動くシヌンでも正しい 方向䟝存色が出せる 08
  8. 提案手法(5/5)䞍透明床の時間倉動 u 䞍透明床の定矩 • : スケヌルず回転で決たる共分散行列 • : 時間方向の䞍透明床 u

    時間䟝存の䞍透明床 • 時間方向でも䞭心時刻から離れるほど寄䞎が小さくなる仕組み 時間方向、基準、空間方向の掛け算 09
  9. å­Šç¿’(1/3)損倱関数 u損倱関数 • : 画像レベルの損倱 • : 構造類䌌床(SSIM)の損倱 • :

    知芚損倱 • 今回の蚭定は 再構成の正確さ、構造保持、自然さを同時に満たすための損倱関数 ただし、この損倱関数のみでは速い動きや耇雑なシヌンには䞍向き 10
  10. å­Šç¿’(3/3)呚期的再配眮 u課題 • 正則化の副䜜甚で、シヌンを衚珟するガりシアンの総数が増えすぎる u察策 • ガりシアンが必芁な堎所に、定期的にワヌプさせるサンプリングを行う • : サンプリングスコア

    • : 募配の倧きさ • : 重み(今回の蚭定はどちらも0.5) どのガりスが重芁かを数倀化 3DGSの密床制埡ず同様に、スコアが䜎い領域の ガりシアンの倀を高い領域のものに眮き換える 12
  11. デヌタセット uNeural3DV [Li+, CVPR22] • 6シヌン、19-21台のカメラ • 解像床 2704×2028、30 fps

    uENeRF-Outdoor [Lin+, SIGGRAPH Asia22] • 3シヌン、18台のカメラ • 解像床 1920×1080、60 fps uSelfCap • 独自に収集したデヌタセット • 8シヌン、22-24台のカメラ • 解像床 3840×2160、60 fps 13 Neural3DV [Li+, CVPR22] ENeRF-Outdoor [Lin+, SIGGRAPH Asia22] SelfCap
  12. 実隓蚭定 u孊習環境 • GPU : NVIDIA RTX 4090 × 1台

    • 孊習時間 : 箄1時間 u評䟡指暙 • PSNR : 生成された画像がGTの画像にどれくらい近いかを枬る • DSSIM : 画像の構造的な類䌌床を枬定 • LPIPS : 人間の知芚に近い画像の類䌌性を枬定 14
  13. Ablation Study各コンポヌネントの圱響 • our motion : FreeTimeGS独自の運動衚珟 • 4d regularization

    : 4D正則化 • periodic relocation : 呚期的再配眮 • 4d initialization : 4D初期化 17
  14. たずめ 19 u背景 • レンダリング効率ず品質の䞡立が困難 • 高速・耇雑な運動を扱えない u提案手法 • ガりシアンの䜍眮を単玔な等速盎線運動で衚珟

    • 4D正則化損倱、 呚期的再配眮で安定した最適化ず高品質なレンダリングを 実珟 u結果 • Neural3DV、 ENeRF-Outdoorおよび自䜜デヌタセットにおいお、 既存手法を䞊回った
  15. Appendix(1/3)4D初期化 21 u 初期化の理由 • ガりシアンの「䜍眮」「時間」「速床」をランダムにするず最適化が䞍安定になる 動画のフレヌムずマルチビュヌ画像を䜿っお 合理的な初期倀を䞎える u 初期化の流れ

    1. ROMA [Edstedt+, CVPR24]を䜿っお2D察応点を芋぀ける 2. 3D䞉角枬量で3D点を蚈算 3. フレヌム番号をそのたた時間の初期倀にする 4. 速床の初期化 u 速床の最適化 「速床の孊習率」を時間に応じお埐々に倉化 孊習初期 (t=0) → 粗い倧きな動きをモデリング 孊習埌期 (t=1) → 现かく耇雑な動きをキャプチャ