Upgrade to Pro — share decks privately, control downloads, hide ads and more …

全方位カメラを利用した3D Gaussian Splattingの実行方法の例

全方位カメラを利用した3D Gaussian Splattingの実行方法の例

Avatar for Kenta Itakura

Kenta Itakura

May 08, 2025
Tweet

More Decks by Kenta Itakura

Other Decks in Technology

Transcript

  1. 3D Gaussian Splatting(3DGS)の概要 任意視点からの高品質な3D再構成を可能にする技術 図1:花瓶に対する実行結果 図1, 2, 3 出典: Im

    VisionLabs株式会社 公式X https://x.com/imvisionlabs 図2:樹木細部に対する実行結果 図3:樹木に対する実行結果 点群にガウス分布を割り当て、視点に応じてその分布をレンダリングすることで、 きめ細かな描写とリアルタイム処理を両立可能 従来のNeRF(Neural Radiance Fields)に比べて高速かつ高精細な表現が可能
  2. 3DGSの実行について PCで実行するPostshotやスマートフォン/タブレット内で実行するScaniverseなどがある 項目 Postshot Scaniverse 開発元 Jawset Visual Computing 社

    Niantic Spatial 社 プラットフォーム PC スマートフォン / タブレット 入力 静止画や動画 スマートフォン / タブレットでのスキャン 利便性 様々なパラメータや手法を利用可能 デバイス単体で完結、スキャン操作が簡単 費用 無料 無料 動作要件 Windows 10 以降、NVIDIA GPU( RTX 2060、Quadro T400 / RTX 4000 以上)必須 ・iPhone Xシリーズ以降のモデル (X、11シリーズは一部機能に制限アリ) ・A12 プロセッサ以降を搭載した iPad ・Android 7.0(Nougat)以降のモデル
  3. 3DGS実行のワークフロー 1. 全方位カメラ映像の取得 2. Dual Fisheye 形式の動画を正距円筒図法に変換 3. NeRFStudio を含む3DGS関連ツールを環境構築不要で実行するため

    の仮想実行環境の構築 4. 正距円筒画像を平面投影し、画像群を作成 5. 画像群からフレームを間引く 6. 3D Gaussian Splatting により画像群から3D点群を生成
  4. 正距円筒図法への変換 使用アプリケーション:RICOH360公式アプリ 正距円筒図 法への変換 平面 投影 THEAによ る撮影 間引き Postshot

    の実行 https://www.ricoh360.com/ja/apps/ アプリに撮影した動画をドラッグ&ドロップで正距円筒図法へ変換
  5. 仮想実行環境の構築 Dockerを利用して仮想実行環境を構築 動画が保存されているフォルダで、以下のコマンドを実行し、DockerContainerを起動 Container起動後、コンテナ内で以下のコマンドを実行し、正距円筒図法を平面投影 ※ 同様の処理はffmpegでも実行可能 ns-process-data video --camera-type equirectangular

    --images-per-equirect 8 --data R0010240_st.MP4 --output-dir image_planer docker run --gpus all ` -v ${PWD}:/workspace/ ` -w /workspace/ ` -p 7007:7007 ` --rm ` -it ` --shm-size=12gb ` ghcr.io/nerfstudio-project/nerfstudio:main 正距円筒図 法への変換 平面 投影 THEAによ る撮影 間引き Postshot の実行
  6. 3DGSへの変換 専用アプリPostshotを使用して、画像群を3DGSに変換 画像群をPostshotにドラッグ&ドロップすると学習を開始 主な学習パラメータ パラメータ名 内容 デフォルト 今回の設定 ImageSelection 使用画像の選択

    UseBestImages Use All Images DownSampleImages 画像サイズ調整 1600 1600 MaxSplatCount 点群密度 3000k 3000k StopTrainingAfter 学習ステップ数 30k 68k 正距円筒図 法への変換 平面 投影 THEAによ る撮影 間引き Postshot の実行
  7. SSIMの有効化 設定で有効化することにより、SSIM(構造的類似度指標)を表示することが可能 SSIM:画像構造の類似度の観点から評価する画像評価指標 ➢ 画素(輝度値) ➢ 構造(被写体の構造) ➢ コントラスト 𝑆𝑆𝐼𝑀(𝑥,

    𝑦) = (2𝜇𝑥 𝜇𝑦 + 𝐶1 )(2𝜎𝑥𝑦 + 𝐶2 ) (𝜇𝑥 2 + 𝜇𝑦 2 + 𝐶1 )(𝜎𝑥 2 + 𝜎𝑦 2 + 𝐶2 ) ・ 𝜇𝑥 , 𝜇𝑦 :画像 x, y の平均画素値 ・ 𝜎𝑥 2, 𝜎𝑦 2 :画像 x, y の分散 ・ 𝜎𝑥𝑦 :画像 x, y の共分散 ・ 𝐶1 , 𝐶2 :定数 計算式 正距円筒図 法への変換 平面 投影 THEAによ る撮影 間引き Postshot の実行
  8. 3DGSの実行結果 2 池の周辺を変換した結果 画像出典:Deliberate Learning https://tech-deliberate-jiro.com/downsampling-grid/ ➢ 植生や構造物に加えて、水面の 再現にも成功 ➢

    元の動画には明確に映っていな かった水面と地面との段差も、やや 粗いながらも再現できた ➢ 撮影者から離れた対岸の植生につ いても再現できた 正距円筒図 法への変換 平面 投影 THEAによ る撮影 間引き Postshot の実行