Upgrade to Pro — share decks privately, control downloads, hide ads and more …

独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化 / Fast online algorithms for independent vector analysis

独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化 / Fast online algorithms for independent vector analysis

日本音響学会2023年春季研究発表会

Taishi Nakashima

March 17, 2023
Tweet

More Decks by Taishi Nakashima

Other Decks in Research

Transcript

  1. 独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化 日本音響学会 2023 年春季研究発表会 3-1-6 ◎中嶋 大志 1,2 池下 林太郎

    3 小野 順貴 1 荒木 章子 3 中谷 智広 3 1 東京都立大学大学院 システムデザイン研究科 情報科学域 博士後期課程 2 年 2 日本学術振興会 特別研究員 (DC1) 3 NTT コミュニケーション基礎科学研究所 2023 年 3 月 17 日
  2. 研究背景 1/12 オンライン音源分離 • 複数の音源が混合した信号から逐次的に個別の信号を推定する技術 ෼཭৴߸ ؍ଌ৴߸ ϒϥΠϯυ Իݯ෼཭ 

    ϑϨʔϜ  ϑϨʔϜ     • 独立ベクトル分析 (IVA) [Kim+2006,Hiroe2006] のオンラインアルゴリズム ∘ オンライン自然勾配降下法 [Kim2010] ∘ オンライン補助関数型 IVA(オンライン AuxIVA) [Taniguchi+2014] � 安定かつ収束が速い
  3. オンライン AuxIVA [Taniguchi+2014] 2/12 • 分離行列の最適化 min. ∑ 𝑘 推定

    𝒘H 𝑘,𝑡 𝑉𝑘,𝑡 推定 𝒘𝑘,𝑡 − log|det 推定 𝑊𝑡 |2 � 共分散行列の逐次更新 𝑉𝑘,𝑡 ← 忘却係数 𝛼 過去の共分散 𝑉𝑘,𝑡−1 + (1 − 𝛼) 重み 𝜑(𝑟𝑘,𝑡 ) 現在の観測信号 𝒙𝑡 𝒙H 𝑡 � バッチ AuxIVA [Ono2011] の分離行列最適化手法をそのまま適用可能 ∘ Iterative projection (IP) [Ono2011] � Online IP [Taniguchi+2014] ∘ Iterative source steering (ISS) [Scheibler&Ono2020] � Online ISS [Nakashima&Ono2022]
  4. オンライン AuxIVA [Taniguchi+2014] 2/12 • 分離行列の最適化 min. ∑ 𝑘 推定

    𝒘H 𝑘,𝑡 𝑉𝑘,𝑡 推定 𝒘𝑘,𝑡 − log|det 推定 𝑊𝑡 |2 � 共分散行列の逐次更新 𝑉𝑘,𝑡 ← 忘却係数 𝛼 過去の共分散 𝑉𝑘,𝑡−1 + (1 − 𝛼) 重み 𝜑(𝑟𝑘,𝑡 ) 現在の観測信号 𝒙𝑡 𝒙H 𝑡 � バッチ AuxIVA [Ono2011] の分離行列最適化手法をそのまま適用可能 ∘ Iterative projection (IP) [Ono2011] � Online IP [Taniguchi+2014] ∘ Iterative source steering (ISS) [Scheibler&Ono2020] � Online ISS [Nakashima&Ono2022]
  5. オンライン AuxIVA [Taniguchi+2014] 2/12 • 分離行列の最適化 min. ∑ 𝑘 𝒘H

    𝑘,𝑡 𝑉𝑘,𝑡 𝒘𝑘,𝑡 − log|det 𝑊𝑡 |2 � 共分散行列の逐次更新 � 計算量が大きい � 問題を制限 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 � バッチ AuxIVA [Ono2011] の分離行列最適化手法をそのまま適用可能 ∘ Iterative projection (IP) [Ono2011] � Online IP [Taniguchi+2014] ∘ Iterative source steering (ISS) [Scheibler&Ono2020] � Online ISS [Nakashima&Ono2022]
  6. 本研究の成果: 1 音源追跡問題に対する Online ISS の高速化 3/12 1 音源追跡 1

    個のみの音源が移動する状況でそのステアリングベクトル 𝒂 移動音源のインデクス ℓ,𝑡 を推定する問題
  7. 本研究の成果: 1 音源追跡問題に対する Online ISS の高速化 3/12 1 音源追跡 1

    個のみの音源が移動する状況でそのステアリングベクトル 𝒂 移動音源のインデクス ℓ,𝑡 を推定する問題 1 周波数・1 フレームあたりの分離行列更新に必要な計算量 手法 𝒚𝑡 の計算 𝒂ℓ,𝑡 の更新 理論限界 𝑂( 音源数 𝐾2) 𝑂(𝐾) Online IP/ISS 𝑂(𝐾2) 後述 𝑂(𝐾3)
  8. 本研究の成果: 1 音源追跡問題に対する Online ISS の高速化 3/12 1 音源追跡 1

    個のみの音源が移動する状況でそのステアリングベクトル 𝒂 移動音源のインデクス ℓ,𝑡 を推定する問題 1 周波数・1 フレームあたりの分離行列更新に必要な計算量 手法 𝒚𝑡 の計算 𝒂ℓ,𝑡 の更新 理論限界 𝑂( 音源数 𝐾2) 𝑂(𝐾) Online IP/ISS 𝑂(𝐾2) 後述 𝑂(𝐾3) Online source steering(OSS) 🆕 𝑂(𝐾2) 𝑂(𝐾2) FastOSS 🆕 𝑂(𝐾2) 𝑂(𝐾) � 提案手法 FastOSS は 1 音源追跡における理論限界を達成
  9. 1 音源追跡における Online IP と Online ISS の違い 4/12 Online

    IP 分離ベクトル 𝒘𝑘,𝑡 を更新 � 毎フレームですべての分離ベクトル 𝒘1,𝑡 , … , 𝒘𝐾,𝑡 の更新が必要 � 1 音源追跡に不適
  10. 1 音源追跡における Online IP と Online ISS の違い 4/12 Online

    IP 分離ベクトル 𝒘𝑘,𝑡 を更新 � 毎フレームですべての分離ベクトル 𝒘1,𝑡 , … , 𝒘𝐾,𝑡 の更新が必要 � 1 音源追跡に不適
  11. 1 音源追跡における Online IP と Online ISS の違い 4/12 Online

    IP 分離ベクトル 𝒘𝑘,𝑡 を更新 � 毎フレームですべての分離ベクトル 𝒘1,𝑡 , … , 𝒘𝐾,𝑡 の更新が必要 � 1 音源追跡に不適
  12. 1 音源追跡における Online IP と Online ISS の違い 4/12 Online

    IP 分離ベクトル 𝒘𝑘,𝑡 を更新 � 毎フレームですべての分離ベクトル 𝒘1,𝑡 , … , 𝒘𝐾,𝑡 の更新が必要 � 1 音源追跡に不適
  13. 1 音源追跡における Online IP と Online ISS の違い 4/12 Online

    IP 分離ベクトル 𝒘𝑘,𝑡 を更新 � 毎フレームですべての分離ベクトル 𝒘1,𝑡 , … , 𝒘𝐾,𝑡 の更新が必要 � 1 音源追跡に不適
  14. 1 音源追跡における Online IP と Online ISS の違い 4/12 Online

    IP 分離ベクトル 𝒘𝑘,𝑡 を更新 � 毎フレームですべての分離ベクトル 𝒘1,𝑡 , … , 𝒘𝐾,𝑡 の更新が必要 � 1 音源追跡に不適
  15. 1 音源追跡における Online IP と Online ISS の違い 4/12 Online

    IP 分離ベクトル 𝒘𝑘,𝑡 を更新 � 毎フレームですべての分離ベクトル 𝒘1,𝑡 , … , 𝒘𝐾,𝑡 の更新が必要 � 1 音源追跡に不適
  16. 1 音源追跡における Online IP と Online ISS の違い 4/12 Online

    IP 分離ベクトル 𝒘𝑘,𝑡 を更新 � 毎フレームですべての分離ベクトル 𝒘1,𝑡 , … , 𝒘𝐾,𝑡 の更新が必要 � 1 音源追跡に不適 Online ISS ステアリングベクトル 𝒂𝑘,𝑡 を更新 � 移動音源のステアリングベクトル 𝒂ℓ,𝑡 だけを狙って更新可能(後述) � 1 音源追跡に好適 [Nakashima&Ono2022]
  17. 従来手法 Online ISS を用いた 1 音源追跡 5/12 ISS の性質 [Scheibler&Ono2020]

    ステアリングベクトル 𝒂ℓ,𝑡 の更新と分離行列 𝑊𝑡 の行基本変形が等価 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 𝑔𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 𝐺𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1 𝒘𝑘,𝑡 ← { 𝒘𝑘,𝑡−1 − 𝑔𝑘,𝑡 𝐺𝑘,𝑡 𝒘ℓ,𝑡−1 (𝑘 ≠ ℓ) 𝐺−1/2 ℓ,𝑡 𝒘ℓ,𝑡−1 (𝑘 = ℓ)
  18. 従来手法 Online ISS を用いた 1 音源追跡 5/12 ISS の性質 [Scheibler&Ono2020]

    ステアリングベクトル 𝒂ℓ,𝑡 の更新と分離行列 𝑊𝑡 の行基本変形が等価 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 𝑔𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 𝐺𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1 𝒘𝑘,𝑡 ← { 𝒘𝑘,𝑡−1 − 𝑔𝑘,𝑡 𝐺𝑘,𝑡 𝒘ℓ,𝑡−1 (𝑘 ≠ ℓ) 𝐺−1/2 ℓ,𝑡 𝒘ℓ,𝑡−1 (𝑘 = ℓ) Online ISS の課題 すべての音源に対する共分散行列 𝑉𝑘,𝑡 の更新に 𝑂(𝐾3) の計算量が必要
  19. 従来手法 Online ISS を用いた 1 音源追跡 5/12 ISS の性質 [Scheibler&Ono2020]

    ステアリングベクトル 𝒂ℓ,𝑡 の更新と分離行列 𝑊𝑡 の行基本変形が等価 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 𝑔𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 𝐺𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1 𝒘𝑘,𝑡 ← { 𝒘𝑘,𝑡−1 − 𝑔𝑘,𝑡 𝐺𝑘,𝑡 𝒘ℓ,𝑡−1 (𝑘 ≠ ℓ) 𝐺−1/2 ℓ,𝑡 𝒘ℓ,𝑡−1 (𝑘 = ℓ) Online ISS の課題 すべての音源に対する共分散行列 𝑉𝑘,𝑡 の更新に 𝑂(𝐾3) の計算量が必要 � 𝑔𝑘,𝑡 , 𝐺𝑘,𝑡 の漸化式を解いて 𝑉𝑘,𝑡 を消去
  20. 提案手法の導出 6/12 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡

    𝒙H 𝑡 𝑔𝑘,𝑡 = 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 𝐺𝑘,𝑡 = 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1
  21. 提案手法の導出 6/12 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡

    𝒙H 𝑡 𝑔𝑘,𝑡 = 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 = 𝒘H ℓ,𝑡−1 (𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 ) 𝒘𝑘,𝑡−1 𝐺𝑘,𝑡 = 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1 = 𝒘H ℓ,𝑡−1 (𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 ) 𝒘ℓ,𝑡−1
  22. 提案手法の導出 6/12 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡

    𝒙H 𝑡 𝑔𝑘,𝑡 = 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 = 𝒘H ℓ,𝑡−1 (𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 ) 𝒘𝑘,𝑡−1 = 𝛼 → 0(割愛) 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡−1 𝒘𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 ) ≔ ̂ 𝑦ℓ,𝑡 (𝒘H ℓ,𝑡−1 𝒙𝑡 ) ≔ ̂ 𝑦∗ 𝑘,𝑡 (𝒙H 𝑡 𝒘𝑘,𝑡−1 ) 𝐺𝑘,𝑡 = 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1 = 𝒘H ℓ,𝑡−1 (𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 ) 𝒘ℓ,𝑡−1 = 𝛼 → 𝐺𝑘,𝑡−1 𝐺ℓ,𝑡−1 (割愛) 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡−1 𝒘ℓ,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 ) ≔ ̂ 𝑦ℓ,𝑡 (𝒘H ℓ,𝑡−1 𝒙𝑡 ) ≔ ̂ 𝑦∗ ℓ,𝑡 (𝒙H 𝑡 𝒘ℓ,𝑡−1 )
  23. 提案手法の導出 6/12 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡

    𝒙H 𝑡 𝑔𝑘,𝑡 = 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 = 𝒘H ℓ,𝑡−1 (𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 ) 𝒘𝑘,𝑡−1 = 𝛼𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡−1 𝒘𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 ) ≔ ̂ 𝑦ℓ,𝑡 (𝒘H ℓ,𝑡−1 𝒙𝑡 ) ≔ ̂ 𝑦∗ 𝑘,𝑡 (𝒙H 𝑡 𝒘𝑘,𝑡−1 ) = (1 − 𝛼)𝜑(𝑟𝑘,𝑡 ) ̂ 𝑦ℓ,𝑡 ̂ 𝑦∗ 𝑘,𝑡 𝐺𝑘,𝑡 = 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1 = 𝒘H ℓ,𝑡−1 (𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 ) 𝒘ℓ,𝑡−1 = 𝛼𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡−1 𝒘ℓ,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 ) ≔ ̂ 𝑦ℓ,𝑡 (𝒘H ℓ,𝑡−1 𝒙𝑡 ) ≔ ̂ 𝑦∗ ℓ,𝑡 (𝒙H 𝑡 𝒘ℓ,𝑡−1 ) = 𝛼𝐺𝑘,𝑡−1 𝐺ℓ,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )| ̂ 𝑦ℓ,𝑡 |2
  24. 提案手法 1: Online source steering (OSS) 7/12 Online ISS(従来手法) 𝑉𝑘,𝑡

    ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 𝑔𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 � ボトルネック 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 𝐺𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1 𝒘𝑘,𝑡 ← { 𝒘𝑘,𝑡−1 − 𝑔𝑘,𝑡 𝐺𝑘,𝑡 𝒘ℓ,𝑡−1 (𝑘 ≠ ℓ) 𝐺−1/2 ℓ,𝑡 𝒘ℓ,𝑡−1 (𝑘 = ℓ) � 𝑉𝑘,𝑡 の更新: 𝑂(𝐾2) � 𝑔𝑘,𝑡 , 𝐺𝑘,𝑡 の更新: 𝑂(𝐾2) � 全体の計算量: 𝑂(𝐾3)
  25. 提案手法 1: Online source steering (OSS) 7/12 Online ISS(従来手法) 𝑉𝑘,𝑡

    ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 𝑔𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 � ボトルネック 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 𝐺𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1 𝒘𝑘,𝑡 ← { 𝒘𝑘,𝑡−1 − 𝑔𝑘,𝑡 𝐺𝑘,𝑡 𝒘ℓ,𝑡−1 (𝑘 ≠ ℓ) 𝐺−1/2 ℓ,𝑡 𝒘ℓ,𝑡−1 (𝑘 = ℓ) � 𝑉𝑘,𝑡 の更新: 𝑂(𝐾2) � 𝑔𝑘,𝑡 , 𝐺𝑘,𝑡 の更新: 𝑂(𝐾2) � 全体の計算量: 𝑂(𝐾3) Online source steering (OSS) 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 𝑔𝑘,𝑡 ← (1 − 𝛼)𝜑(𝑟𝑘,𝑡 ) ̂ 𝑦𝑘,𝑡 ̂ 𝑦∗ ℓ,𝑡 𝐺𝑘,𝑡 ← 𝛼 𝐺𝑘,𝑡−1 𝐺ℓ,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )| ̂ 𝑦ℓ,𝑡 |2 𝒘𝑘,𝑡 ← { 𝒘𝑘,𝑡−1 − 𝑔𝑘,𝑡 𝐺𝑘,𝑡 𝒘ℓ,𝑡−1 (𝑘 ≠ ℓ) 𝐺−1/2 ℓ,𝑡 𝒘ℓ,𝑡−1 (𝑘 = ℓ) � 𝑉𝑘,𝑡 の更新: なし � 𝑔𝑘,𝑡 , 𝐺𝑘,𝑡 の更新: 𝑂(1) 🤔 全体の計算量: 𝑂(𝐾2)
  26. 提案手法 1: Online source steering (OSS) 7/12 Online ISS(従来手法) 𝑉𝑘,𝑡

    ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 𝑔𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 � ボトルネック 𝑉𝑘,𝑡 𝒘𝑘,𝑡−1 𝐺𝑘,𝑡 ← 𝒘H ℓ,𝑡−1 𝑉𝑘,𝑡 𝒘ℓ,𝑡−1 𝒘𝑘,𝑡 ← { 𝒘𝑘,𝑡−1 − 𝑔𝑘,𝑡 𝐺𝑘,𝑡 𝒘ℓ,𝑡−1 (𝑘 ≠ ℓ) 𝐺−1/2 ℓ,𝑡 𝒘ℓ,𝑡−1 (𝑘 = ℓ) � 𝑉𝑘,𝑡 の更新: 𝑂(𝐾2) � 𝑔𝑘,𝑡 , 𝐺𝑘,𝑡 の更新: 𝑂(𝐾2) � 全体の計算量: 𝑂(𝐾3) Online source steering (OSS) 𝑉𝑘,𝑡 ← 𝛼𝑉𝑘,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )𝒙𝑡 𝒙H 𝑡 𝑔𝑘,𝑡 ← (1 − 𝛼)𝜑(𝑟𝑘,𝑡 ) ̂ 𝑦𝑘,𝑡 ̂ 𝑦∗ ℓ,𝑡 𝐺𝑘,𝑡 ← 𝛼 𝐺𝑘,𝑡−1 𝐺ℓ,𝑡−1 + (1 − 𝛼)𝜑(𝑟𝑘,𝑡 )| ̂ 𝑦ℓ,𝑡 |2 𝒘𝑘,𝑡 ← 1 音源あたり 𝑂(𝐾) 処理全体で 𝑂(𝐾2) { 𝒘𝑘,𝑡−1 − 𝑔𝑘,𝑡 𝐺𝑘,𝑡 𝒘ℓ,𝑡−1 (𝑘 ≠ ℓ) 𝐺−1/2 ℓ,𝑡 𝒘ℓ,𝑡−1 (𝑘 = ℓ) � 𝑉𝑘,𝑡 の更新: なし � 𝑔𝑘,𝑡 , 𝐺𝑘,𝑡 の更新: 𝑂(1) 🤔 全体の計算量: 𝑂(𝐾2) � 高速化
  27. 提案手法 2: FastOSS 8/12 • 方法: 分離行列の乗算更新を用いた OSS の再定義 𝑊𝑡

    = 𝑄𝑡 𝑊𝑡−1 = 𝑄𝑡 𝑄𝑡−1 𝑊𝑡−2 ⋮ = (𝑄𝑡 𝑄𝑡−1 ⋯ 𝑄𝑇′+1 )𝑊 目的音源の移動時刻 𝑇′ ≕ ̃ 𝑄𝑡 𝑊𝑇′
  28. 提案手法 2: FastOSS 8/12 • 方法: 分離行列の乗算更新を用いた OSS の再定義 𝑊𝑡

    = 𝑄𝑡 𝑊𝑡−1 = 𝑄𝑡 𝑄𝑡−1 𝑊𝑡−2 ⋮ = (𝑄𝑡 𝑄𝑡−1 ⋯ 𝑄𝑇′+1 )𝑊 目的音源の移動時刻 𝑇′ ≕ ̃ 𝑄𝑡 𝑊𝑇′ • 𝑄𝑡 の 1 列だけを更新 � 𝐾 個のパラメータだけ更新すればよいので 𝑂(𝐾) で更新可能 � 𝑄𝑡 𝑄𝑡−1 も 𝑂(𝐾) で更新可能 � 1 音源追跡の理論限界! � ただし 𝒚𝑡 = 𝑊𝑡 𝒙𝑡 が避けられないため処理全体では 𝑂(𝐾2)
  29. 実験条件 9/12 マイク・音源配置 1 2 3 4 40 6.0 m

    4.0 m Height = 2.75 m Mic. Fixed Moving • 音源・マイク数: 4 • 残響時間: 約 300 ms � 音源 4 は瞬間的に移動
  30. 実験条件 9/12 マイク・音源配置 1 2 3 4 40 6.0 m

    4.0 m Height = 2.75 m Mic. Fixed Moving • 音源・マイク数: 4 • 残響時間: 約 300 ms � 音源 4 は瞬間的に移動 比較手法 • Online IP • Online ISS 🆕 OSS 🆕 FastOSS 注意 � Online ISS, OSS, FastOSS は 等価な更新を異なる計算方法で実現 � いつ・どの音源が移動したかは既知
  31. 分離性能 10/12   4PVSDF  044 0OMJOF *1 4PVSDF

            5JNF T   4PVSDF         5JNF T 4PVSDF  4%3 JNQSPWFNFOUT E#
  32. 分離性能 10/12   4PVSDF  4PVSDF   

         5JNF T   4PVSDF         5JNF T 4PVSDF  4%3 JNQSPWFNFOUT E# ԻݯͷҠಈલ 0OMJOF*1Ͱ෼཭ߦྻΛߋ৽
  33. 分離性能 10/12   4PVSDF  4PVSDF   

         5JNF T   4PVSDF         5JNF T 4PVSDF  4%3 JNQSPWFNFOUT E# Իݯ͕Ҡಈ 0OMJOF*1Ͱߋ৽ͨ͠ ෼཭ߦྻΛॳظ஋ͱͯ͠Իݯ௥੻
  34. 分離性能 10/12   4PVSDF  044 0OMJOF *1 4PVSDF

            5JNF T   4PVSDF         5JNF T 4PVSDF  4%3 JNQSPWFNFOUT E# � OSS はステアリングベクトルを 1 個更新するだけで 分離行列全体を更新する Online IP に接近した性能
  35. 30 秒の信号に対する実行時間 11/12     5IF OVNCFS PG

    DIBOOFMT      3VOUJNF T                 *Run on AMD EPYC 7643 48-core [email protected] GHz .FUIPE 'BTU044 044 0OMJOF *44 0OMJOF *1 • 音源数を 3,4,5,6 と変化させ実行時間を計測 � OSS はすべての条件で従来手法よりも 3 倍以上高速
  36. 30 秒の信号に対する実行時間 11/12     5IF OVNCFS PG

    DIBOOFMT      3VOUJNF T                 *Run on AMD EPYC 7643 48-core [email protected] GHz .FUIPE 'BTU044 044 0OMJOF *44 0OMJOF *1 • 音源数を 3,4,5,6 と変化させ実行時間を計測 � OSS はすべての条件で従来手法よりも 3 倍以上高速
  37. おわりに 12/12 本発表のまとめ • 1 音源追跡: 1 個の音源のみが移動する状況の音源分離 • 1

    音源追跡のための高速なステアリングベクトル更新 OSS, FastOSS の提案
  38. おわりに 12/12 本発表のまとめ • 1 音源追跡: 1 個の音源のみが移動する状況の音源分離 • 1

    音源追跡のための高速なステアリングベクトル更新 OSS, FastOSS の提案 手法 𝒚𝑡 の計算 𝒂ℓ,𝑡 の更新 理論限界 𝑂(𝐾2) 𝑂(𝐾) Online IP/ISS 𝑂(𝐾2) 𝑂(𝐾3) OSS 🆕 𝑂(𝐾2) 𝑂(𝐾2) FastOSS 🆕 𝑂(𝐾2) � (ほぼ)理論限界を達成! 𝑂(𝐾)
  39. おわりに 12/12 本発表のまとめ • 1 音源追跡: 1 個の音源のみが移動する状況の音源分離 • 1

    音源追跡のための高速なステアリングベクトル更新 OSS, FastOSS の提案 手法 𝒚𝑡 の計算 𝒂ℓ,𝑡 の更新 理論限界 𝑂(𝐾2) 𝑂(𝐾) Online IP/ISS 𝑂(𝐾2) 𝑂(𝐾3) OSS 🆕 𝑂(𝐾2) 𝑂(𝐾2) FastOSS 🆕 𝑂(𝐾2) � (ほぼ)理論限界を達成! 𝑂(𝐾) 今後の課題 • 2 音源追跡のための OSS, FastOSS の提案(投稿準備中)
  40. 参考文献 [Hiroe2006] A. Hiroe, “Solution of permutation problem in frequency

    domain ICA, using multivariate probability density functions,” in Proc. ICA, pp. 601–608, Mar. 2006. [Kim+2006] T. Kim, H. T. Attias, S.-Y. Lee, and T.-W. Lee, “Blind source separation exploiting higher-order frequency dependencies,” IEEE/ACM Trans. Audio, Speech, Language Process., vol. 15, no. 1, pp. 70–79, Jan. 2006. [Kim2010] T. Kim, “Real-time independent vector analysis for convolutive blind source separation,” IEEE Trans. Circuits Syst. I, vol. 57, no. 7, pp. 1431–1438, 2010. [Nakashima&Ono2022] T. Nakashima and N. Ono, “Inverse-free online independent vector analysis with flexible iterative source steering,” in Proc. APSIPA, pp. 750–754, Nov. 2022. [Ono2011] N. Ono, “Stable and fast update rules for independent vector analysis based on auxiliary function technique,” in Proc. WASPAA, pp. 189–192, Oct. 2011. [Scheibler&Ono2020] R. Scheibler and N. Ono, “Fast and stable blind source separation with rank-1 updates,” in Proc. ICASSP, pp. 236–240, 2020. [Taniguchi+2014] T. Taniguchi, N. Ono, A. Kawamura, and S. Sagayama, “An auxiliary-function approach to online independent vector analysis for real-time blind source separation,” in Proc. HSCMA, pp. 107–111, May 2014.