Upgrade to Pro — share decks privately, control downloads, hide ads and more …

X-maps: Direct Depth Lookup for Event-based Str...

X-maps: Direct Depth Lookup for Event-based Structured Light Systems

X-maps: Direct Depth Lookup for Event-based Structured Light Systems[Morgenstern+, CVPRW2023] (https://fraunhoferhhi.github.io/X-maps/) の論文紹介資料です.

イベントカメラとレーザプロジェクタを用いた構造化光による深度推定手法です.X-mapsと呼ばれるデータ構造を事前計算することで,従来手法で問題となっていた対応点探索を不要にし,リアルタイムな深度推定を実現しています.

p.2 https://fraunhoferhhi.github.io/X-maps/static/videos/x_maps_hand_demo_h264.mp4
p.4,8,9 MC3D: Motion Contrast 3D Scanning [Matsuda+, ICCP2015] (https://compphotolab.northwestern.edu/project/mc3d-motion-contrast-3d-laser-scanner/)
p.5(※1) https://support.prophesee.ai/portal/en/kb/articles/evk1-vga-camera-manual
p.5(※2) 高谷剛志, イベントカメラの基礎と応用[CVIM研究会 チュートリアル 2024] (https://speakerdeck.com/t244/ibentokameranoji-chu-toying-yong)
p.7 https://anybeamstore.com/en/home-3/mems-laser-technology-en/
p.9,10,18 ESL: Event-based Structured Light [Muglikar+, 3DV 2021] (https://rpg.ifi.uzh.ch/esl.html)
p.25, 26 [Prophesee Metavision® EVK3D] (https://www.prophesee.ai/event-camera-structured-light-evk-3d/)
p.27 EventPS: Real-Time Photometric Stereo Using an Event Camera[Bohan+, CVPR2024] (https://www.ybh1998.space/eventps-real-time-photometric-stereo-using-an-event-camera/)
p.28 Event-based Shape from Polarization[Muglikar+, CVPR2023] (https://rpg.ifi.uzh.ch/esfp.html)

Spatial AI Network

January 20, 2025
Tweet

More Decks by Spatial AI Network

Other Decks in Technology

Transcript

  1. X-maps: Direct Depth Lookup for Event-based Structured Light Systems  

    ⽔⾕ 航太(京都⼯芸繊維⼤学)   Authors: Wieland Morgenstern, Niklas Gard, Simon Baumann, Anna Hilsmann, Peter Eisert Venue: CVPR 2023 Workshop on Event-based vision Web: https://fraunhoferhhi.github.io/X-maps/ ※特に注釈がない場合,図や表はいずれも該当論⽂からの引⽤です 2024/12/21 第1回 Spatial AI Network勉強会
  2. 3次元形状計測 • ステレオ視形状(奥⾏)分解能は画像解像度依存.エラーの原因は対応点探索 ◦ パッシブステレオ (e.g., StereoLabs ZED 2) ◦

    アクティブステレオ ▪ 1-shot • ランダムドット (e.g., MS Kinect v1, Intel RealSense) • デブルーイン系列 ▪ N-shot • スポット光 (1点) • スリット光 (ライン) • グレイコード • Phase-shift • 照度差ステレオ • Time-of-Flight ◦ 1-shot ▪ ToFカメラ (e.g., MS Kinect v2) ◦ N-shot ▪ LiDAR 4 本⼿法 ※1 MC3D: Motion Contrast 3D Scanning [Matsuda+, ICCP2015](https://compphotolab.northwestern.edu/project/mc3d-motion-contrast-3d-laser-scanner/) ※1
  3. イベントカメラとは 5 • 各画素独⽴に輝度変化(イベント)を検出するカメラ ⾼時間分解能(1μs) ⾼ダイナミックレンジ(120dB) 低消費電⼒(10mW) (   従来のカメラは全画素同時に輝度を検出) イベントカメラ

    従来のカメラ ※1 https://support.prophesee.ai/portal/en/kb/articles/evk1-vga-camera-manual ※2 高谷剛志, イベントカメラの基礎と応用[CVIM研究会 チュートリアル 2024](https://speakerdeck.com/t244/ibentokameranoji-chu-toying-yong) ※1 ※2
  4. レーザプロジェクタとは • 基本原理 ◦ RGBのレーザーをMEMSミラーで制御 ◦ 高速なスキャンで映像を描画 ◦ 実際には各時刻で1点しか光らない ▪

    ブラウン管と同じ • 利点 ◦ 構造化光として使える ◦ 焦点調整不要 ◦ 安価な市販品を利用可能 7 MEMSミラー レーザポインタの⾊を変化させながらシーン全体をスキャンするもの ※1 https://anybeamstore.com/en/home-3/mems-laser-technology-en/ ※1
  5. イベントベース構造化光 8 • イベントが発⽣すると,対応点が⾃動的に決まる ◦ イベントカメラ側:画素位置と,イベント発生時刻が決まる ◦ プロジェクタ側:イベント発生時刻に光ってた画素が決まる • イベント検出の時間精度が対応点探索の精度になる

    アイデア: ⾼速なレーザスキャンをイベントカメラで撮影する フレームカメラ (無駄な領域が多い) イベントカメラ (必要な情報だけ) ※1 ※2 ※1,2 MC3D: Motion Contrast 3D Scanning [Matsuda+, ICCP2015](https://compphotolab.northwestern.edu/project/mc3d-motion-contrast-3d-laser-scanner/)
  6. MC3D: Motion Contrast 3D Scanning [Matsuda+, ICCP2015] 9 • エピポーラ線上で対応点を探索

    ◦ イベント発生時刻とプロジェクタ照射角度は比例する イベント発⽣時刻からプロジェクタ照射⾓度を推定 深度マップ 撮影シーン ※1 MC3D: Motion Contrast 3D Scanning [Matsuda+, ICCP2015](https://compphotolab.northwestern.edu/project/mc3d-motion-contrast-3d-laser-scanner/) ※2 ESL: Event-based Structured Light [Muglikar+, 3DV 2021](https://rpg.ifi.uzh.ch/esl.html) ※2 ※1
  7. ESL: Event-based Structured Light [Muglikar+, 3DV 2021] • イベントをタイムマップに変換 •

    タイムマップのエピポーラ線上で対応点を探索 •  ➜ 画素ごとに対応点を探索するので計算量が⼤きい 10 時刻が⼀致する座標を探索して対応点として利⽤ 深度マップ 撮影シーン ※2 ※1 ※1,2 ESL: Event-based Structured Light [Muglikar+, 3DV 2021](https://rpg.ifi.uzh.ch/esl.html)
  8. アイデア 13 • X-mapsとは ◦ カメラで観測されたイベントが,どのプロジェクタ座標から来たものか を直接格納したデータ構造 ◦ タイムマップを変換するだけで作成できる •

    利点 ◦ カメラ,プロジェクタ,相対姿勢が決まれば事前に作成可能 ◦ 対応情報を参照するだけで視差が得られる ◦ リアルタイム処理に適した構造 ルックアップテーブルを事前に作成して計算を効率化
  9. 評価⽤データセット 18 David Heart Book-Duck Plant City of Lights Cycle

    Room Desk-chair Desk-books • ESLの公開データセットを使⽤ ◦ すべて静的シーンのイベントデータ 9点 ◦ 最適化後のESLによる推定結果をベースラインとする 時間フィルタを使っていないので 結果を動的シーンにも適⽤できる ESL: Event-based Structured Light [Muglikar+, 3DV 2021](https://rpg.ifi.uzh.ch/esl.html)