Upgrade to Pro — share decks privately, control downloads, hide ads and more …

MIRU2020若手の会グループA発表

Avatar for koki madono koki madono
August 01, 2020

 MIRU2020若手の会グループA発表

Avatar for koki madono

koki madono

August 01, 2020
Tweet

More Decks by koki madono

Other Decks in Research

Transcript

  1. 品川 政太朗, 岩本 蘭, ⾼⽥ 雅之, 真殿 航輝, 三好 遼

    Mentor : 福井 宏 Retina-like Visual Image Reconstruction via Spiking Neural Model MIRU若⼿の会2020 Group-A 発表 8/1 (⼟) 16:25~16:55 @zoom
  2. センサの⽐較 Spikeカメラは,ハイスピードなシーンの撮影に向いている. Time スパイク列 1 0 センサ 動作速度 データの取得 ⽅法

    露光時間の設定 従来のカメラ 数⼗Hz 同期 ピクセル毎の設定不可 Spikeカメラ 40,000Hz ⾮同期 ピクセル毎の設定可 3
  3. 提案⼿法の特徴 Spikeカメラを⽤いたハイスピードなシーンの画像再構成を実現 1. Spiking Neural Networksによる画像再構成 2. Dynamic threshold とスパイクの統計情報を活⽤して性能を向上

    Method 動画 Dynamic threshold スパイクの 統計情報の利⽤ TFW(ルールベース) TFI(ルールベース) ✔ TFA(適応的閾値) ✔ Ours ✔ ✔ ✔ 6
  4. 提案モデル : Spiking Neural Network 3つの層で構成 1. Motion local excitation

    layer (MLEL) : 発⽕間隔別に分割 - static(発⽕間隔が⼀定) / dynamic(発⽕間隔が⾮⼀定) に分割 2. Spike refining layer (SRL) : Spike列のノイズ除去 3. Visual reconstruction layer (VRL) : Spike列からの画像再構成 MLEL SRL VRL 認識画像 スパイク列 static dynamic static dynamic 7
  5. 提案モデル : Spiking Neural Network 3つの層で構成 1. Motion local excitation

    layer (MLEL) : 発⽕間隔別に分割 - static(発⽕間隔が⼀定) / dynamic(発⽕間隔が⾮⼀定) に分割 2. Spike refining layer (SRL) : Spike列のノイズ除去 3. Visual reconstruction layer (VRL) : Spike列からの画像再構成 MLEL SRL VRL 認識画像 スパイク列 static dynamic static dynamic 8
  6. Motion local excitation layer (MLEL) ⼊⼒されたスパイク列をstatic/dynamicに分類する層 Spike plane スパイク列 t

    y static/dynamicに分割 Motion confidence matrixの⽣成 dynamic static ⼀定間隔 ✖⼀定間隔 static dynamic スパイク列 MLEL t dynamic t t static x 9
  7. ポイント : 輝度の変化と発⽕間隔が相関 スパイク間隔は 分散の⼩さい 正規分布に従う 輝度が⼀定 t t 発⽕間隔が

    ほぼ⼀定 p(t) スパイク間隔は 分散の⼤きい 正規分布に従う 輝度が⾮⼀定 t t 発⽕間隔が ⼀定でない p(t) スパイクの履歴で 分布近似 スパイク 間隔 スパイク 間隔 static dynamic 11
  8. ポイント : Spike履歴による近似分布からConfidenceを算出 t 新しく観測した Spike列 なだらかな正規分布 StaticなSpikeの履歴でできた正規分布 →Static /

    dynamicの判定が可能 スパイク 間隔 スパイク 間隔 Confidence Confidence 分布近似に使った スパイクの履歴 DynamicなSpikeの履歴でできた正規分布 → Static / dynamicの判定が難しい 急峻な正規分布 急峻 or なだらかな分布に ⼀定 0.9 0.2 12
  9. ConfidenceからMotion confidence matrixの⽣成 static spikeである確率 (Confidence)の計算 Motion confidence matrixの⽣成 dynamic

    スパイク間隔 を観測 static dynamic static ある時刻tのスパイク x y x y t y x t y x スパイク列 Motion confidence matrixの⽣成 static/dynamicに分割 13
  10. グラフカットにより、各要素をstatic/dynamicに分割 Motion confidence matrix T S グラフカットにより MRFのコストを最⼩化する 境界線を探索 T

    S 各要素をstatic/dynamicに領域分割 dynamic static スパイク列 static/dynamicに分割 Motion confidence matrixの⽣成 t y x 14
  11. 提案モデル : Spiking Neural Network 3つの層で構成 1. Motion local excitation

    layer (MLEL) : 発⽕間隔別に分割 - static(発⽕間隔が⼀定) / dynamic(発⽕間隔が⾮⼀定) に分割 2. Spike refining layer (SRL) : Spike列のノイズ除去 3. Visual reconstruction layer (VRL) : Spike列からの画像再構成 MLEL SRL VRL 認識画像 スパイク列 static dynamic static dynamic 15
  12. LIFニューロンを⽤いたノイズ除去を⾏う層 Spike refining layer (SRL) static SRL noise t V

    LIFニューロンの膜電位Vは発⽕してから ⼊⼒スパイクの影響を受けない期間 (不応期) が存在 不応期のスパイクをノイズとみなす⽅法 (ノイズを⾃然に除去することが可能) 不応期 発⽕ dynamic t t static dynamic t t 16
  13. 提案モデル : Spiking Neural Network 3つの層で構成 1. Motion local excitation

    layer (MLEL) : 発⽕間隔別に分割 - static(発⽕間隔が⼀定) / dynamic(発⽕間隔が⾮⼀定) に分割 2. Spike refining layer (SRL) : Spike列のノイズ除去 3. Visual reconstruction layer (VRL) : Spike列からの画像再構成 MLEL SRL VRL 認識画像 スパイク列 static dynamic static dynamic 17
  14. STDP(spike timing dependent plasticity) スパイクからグレースケール画像を再構成する層 STDPによる 教師なし学習 dynamic thresholdに よる画素値算出

    • SNNの教師なし学習に⽤いられる⼿法 • 2層間のスパイクの発⽕タイミングで重みを更新する 2層⽬ 3層⽬ (a) 重みを⼤きくする場合 2層⽬が発⽕→3層⽬が発⽕ (b) 重みを⼩さくする場合 3層⽬が発⽕→2層⽬が発⽕ static/dynamic スパイク 2層⽬ 3層⽬ 19
  15. STDPによる重みの更新計算 スパイクからグレースケール画像を再構成する STDPによる 教師なし学習 dynamic thresholdに よる画素値算出 ある時間区間ごとに各層の発⽕時刻を全て記録し,逐次的に 更新する スパイク発⽕時刻

    • 2層⽬:t!"# = t$, t%, … • 3層⽬:t!&'( = ̂ t$, ̂ t%, … ただし、& A w = A) w > 0, τ = τ) (t!&'( − t!"# > 0) A w = A* w < 0, τ = τ* (t!&'( − t!"# < 0) 重みが増⼤ 重みが減少 時刻の近いスパイクが 更新幅に⼤きく影響する Δw = , !!"# , !!$%& A w exp − t"#$! − t"%& /τ static/dynamic スパイク 20
  16. 重みの初期化⽅法 スパイクからグレースケール画像を再構成する STDPによる 教師なし学習 dynamic thresholdに よる画素値算出 同じ位置に近いほど⼤きな重みとなるよう初期化 (正規分布を利⽤) •

    位置の近いニューロンほど同じタイミングで発⽕ • 再構成時の近傍画素値をスムージングする役割 重みW 2層⽬ 3層⽬ static/dynamic スパイク 21
  17. Dynamic thresholdによる画素値算出 スパイクからグレースケール画像を再構成する STDPによる 教師なし学習 dynamic thresholdに よる画素値算出 Dynamic thresholdとは?

    • ニューロンの発⽕閾値を変化させて発⽕頻度を⼀定にする仕組み • 元々は⽣物ニューロンで知られる同期現象を模すために提案された • 著者らは,LIFモデルを⼀般化したspike response model (SRM) [1] 由来の⼿法を採⽤ [1] Mensi S, Naud R, Pozzorini C, Avermann M, Petersen CC, Gerstner W. Parameter extraction and classification of three cortical neuron types reveals two distinct adaptation mechanisms. J Neurophysiol. 2012;107(6):1756-1775. ん?発⽕頻度が⼀定になる? 発⽕頻度が持っていた輝度情報はどこへ? 代わりにdynamic thresholdが輝度になるにゃ! static/dynamic スパイク 22
  18. ϑ23(t) Dynamic threshold ϑ!" (t)の仕組み V V%&$! t t t

    重み付き⼊⼒スパイクS'( (t) 出⼒スパイクS'( ) (t) お互いに上昇と下降を繰り返す スパイク発⽕時の膜電位が徐々に上 にズレてるところに注⽬だにゃ! 膜電位V dynamic thresholdと膜電位が同 じ値になるとスパイクが出る 輝度 23
  19. 膜電位V ϑ+, t = ϑ- + 2 - . θ+,

    s S+, / t − s ds ϑ23(t) Dynamic threshold ϑ!" (t)の畳み込み計算 V%&$! t t t 重み付き⼊⼒スパイクS'( (t) 出⼒スパイクS'( ) (t) 時間で単調減少するフィルタθ+, t と 出⼒スパイクS+, / (t)の畳み込みで計算 Wikipedia “畳み込み”より θ+, t は指数関数 ϑ+, t ϑ+,(t)は,スパイクが発⽕すると 急上昇して徐々に減少する V 輝度 24 畳み込み : https://ja.wikipedia.org/wiki/%E7%95%B3%E3%81%BF%E8%BE%BC%E3%81%BF#/media/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Convolucion_de_entrada_con_respuesta_al_impulso.gif
  20. フィルタθ+, t は,⼊⼒の総和が ⼤きいほどdynamic thresholdの 下がり具合を⼩さくする →発⽕するまでの閾値が上昇 ϑ23 (t) フィルタによるdynamic

    thresholdの値の変化 V V%&$! t t t 重み付き⼊⼒スパイクS'( (t) 出⼒スパイクS'( ) (t) θ+, t = η- exp − t − t0 τ ∫ (! ( S+, x dx (b) ⼊⼒がstatic のとき (a) ⼊⼒がdynamic のとき θ+, t = η- exp − t − t1 τ フィルタの形と閾値は⼀定 発⽕閾値が上昇 輝度 25
  21. Dynamic threshold ϑ!" t を輝度 G!,",$ として表現 (a) ⼊⼒がdynamic のとき:

    ϑ+, t は動いてるので短い時間区間で近似 (b) ⼊⼒がstaticのとき: ϑ+, t は⼀定値なのでそのまま G2,3,6 = ϑ23 t G+,,,( = ϑ+, t* ⋅ t − t* t* ⋅ 2 - (" S+, x dx *3 V S+, t t t7 ϑ+, t* 輝度の変化を 抑える調整項 輝度 低めに調整 ⾼めに調整 スパイク たくさん来た あまり来ない フィルタの 収束予定値 26
  22. 実験 評価⽅法 1. 画像の⾒た⽬の⽐較( 定性評価 ) 2. 画質評価指標での⽐較 (定量評価 )

    ⽐較⼿法 動画 Dynamic threshold スパイクの統計情報 TFW TFI ✓ TFA ✓ ours ✓ ✓ ✓ 27
  23. まとめ 3層Spiking Neural Networkを⽤いた画像再構成 t スパイク列 ① Motion local excitation

    layer 画像のstatic/dynamicな部分を分割 ② Spike refining layer ノイズ除去 ③ Visual reconstruction layer グレースケール画像の再構成 過去のspike列と動的閾値を考慮し ハイスピードなシーンでの再構成画像の画質改善 32