Nikola Zubic, Mathias Gehrig, Davide Scaramuzza Robotics and Perception Group, University of Zurich, Switzerland イベントカメラを用いた物体検出等を行う従来手法は、学習測度の 問題や、学習時と異なる周波数に対応できない問題を、状態空間 モデル(SSM)を導入することで解決
Recurrent Vision Transformers for Object Detection with Event Cameras. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR) Vision Transformer + LSTMを用いて、イベントカメラから物体検出
Recurrent Vision Transformers for Object Detection with Event Cameras. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR) Vision Transformer + LSTMを用いて、イベントカメラから物体検出 空間内での Local Window Self-Attention 空間内での Dilated Attention
A., & Ré, C. (2020). HiPPO: Recurrent memory with optimal polynomial projections. Advances in Neural Information Processing Systems (NeurIPS). 系列データを関数(直交多項式の和)で近似することで、理論上無限長の 系列を扱うことができる。
K., Dao, T., Rudra, A., & Ré, C. (2021). Combining Recurrent, Convolutional, and Continuous-time Models with Linear State-Space Layers. Advances in Neural Information Processing Systems (NeurIPS) HiPPOを状態空間モデルへ拡張 逐次処理を畳み込み処理として並列化
(2022). Efficiently Modeling Long Sequences With Structured State Spaces. International Conference on Learning Representations (ICLR). 畳み込みカーネルഥ 𝑲の計算を様々な数学的テクニックを用いて簡 略化
Ré, C. (2022). On the Parameterization and Initialization of Diagonal State Space Models. Advances in Neural Information Processing Systems (NeurIPS) HiPPO行列のDPLRからlow-rank項を取り除き、対角行列のみの形にして も、実験的にうまくいくことがわかっている。 この現象を数学的に解析し、S4より簡易な手法を提案
Ré, C. (2022). On the Parameterization and Initialization of Diagonal State Space Models. Advances in Neural Information Processing Systems (NeurIPS) HiPPO行列のDPLRからlow-rank項を取り除き、対角行列のみの形にして も、実験的にうまくいくことがわかっている。 この現象を数学的に解析し、より簡易な手法を提案 対角行列
Linderman, S. W. (2023). Simplified State Space Layers for Sequence Modeling. International Conference on Learning Representation (ICLR) S4は入力𝒖のチャネルを個別に処理するのに対し、S5は全チャネルを一括で処理 S4D同様DPLRの対角成分のみ使用 畳み込み処理の代わりに再帰処理を並列化(Parallel Scan)