Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Search
Shoichi Koyama
September 09, 2021
Research
0
220
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Presentation slides for ASJ2021A.
Shoichi Koyama
September 09, 2021
Tweet
Share
More Decks by Shoichi Koyama
See All by Shoichi Koyama
Weighted Pressure Matching Based on Kernel Interpolation for Sound Field Reproduction
sh01k
0
240
Binaural reproduction from multiple microphone arrays
sh01k
0
180
Sound Field Reproduction With Weighted Mode Matching and Infinite-Dimensional Harmonic Analysis: An Experimental Evaluation
sh01k
0
220
[ASJ2020A: 2.1.15] 音場制御におけるスピーカ・制御点配置最適化法の比較評価
sh01k
0
320
Other Decks in Research
See All in Research
集合間Bregmanダイバージェンスと置換不変NNによるその学習
wasyro
0
120
「どう育てるか」より「どう働きたいか」〜スクラムマスターの最初の一歩〜
hirakawa51
0
440
SSII2025 [SS2] 横浜DeNAベイスターズの躍進を支えたAIプロダクト
ssii
PRO
7
3.8k
近似動的計画入門
mickey_kubo
4
1k
NLP Colloquium
junokim
1
170
SSII2025 [TS2] リモートセンシング画像処理の最前線
ssii
PRO
7
3k
カスタマーサクセスの視点からAWS Summitの展示を考える~製品開発で活用できる勘所~
masakiokuda
2
150
生成的推薦の人気バイアスの分析:暗記の観点から / JSAI2025
upura
0
220
Trust No Bot? Forging Confidence in AI for Software Engineering
tomzimmermann
1
250
SSII2025 [TS1] 光学・物理原理に基づく深層画像生成
ssii
PRO
4
4k
心理言語学の視点から再考する言語モデルの学習過程
chemical_tree
2
510
Self-supervised audiovisual representation learning for remote sensing data
satai
3
240
Featured
See All Featured
Code Review Best Practice
trishagee
69
19k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
50
5.5k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.4k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.5k
Navigating Team Friction
lara
188
15k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
1k
Adopting Sorbet at Scale
ufuk
77
9.5k
[RailsConf 2023] Rails as a piece of cake
palkan
56
5.7k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
110
19k
Measuring & Analyzing Core Web Vitals
bluesmoon
7
530
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Transcript
MeshRIR: ⾳場分析・合成のための 格⼦点上室内⾳響インパルス応答 データセット ⼩⼭ 翔⼀1,⻄⽥智哉1 ,⽊村圭佑1 , 阿部拓実1 ,植野夏樹2
,Jesper Brunnström 1 1東京⼤学,2東京都⽴⼤学
September 9, 2021 2 Ø “MeshRIR”と呼ぶインパルス応答データセットを公開 ü 測定領域を格⼦点上に離散化したインパ ルス応答 ü
⾳場分析・合成⼿法の評価に適したデー タセット ü 2つのサブデータセット • 1⾳源から3次元直⽅体領域まで • 32⾳源から2次元正⽅形領域まで ü いくつかの⾳場分析・合成⼿法のサンプ ルコードも提供 https://sh01k.github.io/MeshRIR/
サブデータセット Ø S1-M3969 – 1⾳源から3次元直⽅体の測定領域 – 測定領域:1.0 m x 1.0
m x 0.4 m – 間隔:0.05 m – 点数:21 x 21 x 9 = 3969点 – 残響時間:0.38 s Ø S32-M441 – 32⾳源から2次元正⽅形の測定領域 – 測定領域:1.0 m x 1.0 m – 間隔:0.05 m – 点数:21 x 21 = 441点 – 残響時間:0.19 s September 9, 2021 3
測定⽅法 Ø 無指向性マイクを3軸直交ロボットに取り付けて測定 – マイクロフォン:Primo EM272J – スピーカ (S1-M3969):DIATONE DS-7
– スピーカ (S32-M441):YAMAHA VXS1MLB – 測定⽤信号:Linear swept sine September 9, 2021 4
測定条件の詳細 September 9, 2021 5 ü ファイル形式はNumpy⽤のNPYとMatlab⽤のMATがダウン ロード可能 ü 付加的なデータはJSONファイルの形式で提供
ü ⾳場分析・合成のサンプルコードも付属
⾳場の可視化結果 Ø S1-M3969を⽤いて⾳場を可視化 September 9, 2021 6 xy平⾯上の分布 y軸上のインパルス応答
⾳場補間∕再構成の評価例 Ø S1-M3969を⽤いて18個のマイク信号から領域全体を推定 September 9, 2021 7 真値 カーネル補間法 [Ueno+
2018] ガウスカーネルを ⽤いた場合 MSE: -5.8 dB MSE: -13.7 dB ⾳圧分布 誤差分布
⾳場合成∕制御の評価例 Ø S32-M441を⽤いて領域内に平⾯波⾳場を合成 September 9, 2021 8 ⾳圧分布 誤差分布 重み付きモードマッチング
[Ueno+ 2019] 多点⾳圧制御 SDR: 3.85 dB SDR: 4.65 dB 真値