Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Search
Shoichi Koyama
September 09, 2021
Research
0
220
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Presentation slides for ASJ2021A.
Shoichi Koyama
September 09, 2021
Tweet
Share
More Decks by Shoichi Koyama
See All by Shoichi Koyama
Weighted Pressure Matching Based on Kernel Interpolation for Sound Field Reproduction
sh01k
0
260
Binaural reproduction from multiple microphone arrays
sh01k
0
200
Sound Field Reproduction With Weighted Mode Matching and Infinite-Dimensional Harmonic Analysis: An Experimental Evaluation
sh01k
0
230
[ASJ2020A: 2.1.15] 音場制御におけるスピーカ・制御点配置最適化法の比較評価
sh01k
0
320
Other Decks in Research
See All in Research
Sat2City:3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion
satai
3
160
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
350
SNLP2025:Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
190
IMC の細かすぎる話 2025
smly
2
700
Mechanistic Interpretability:解釈可能性研究の新たな潮流
koshiro_aoki
1
490
論文紹介: ReGenesis: LLMs can Grow into Reasoning Generalists via Self-Improvement
hisaokatsumi
0
110
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
270
MetaEarth: A Generative Foundation Model for Global-Scale Remote Sensing Image Generation
satai
4
350
論文読み会 SNLP2025 Learning Dynamics of LLM Finetuning. In: ICLR 2025
s_mizuki_nlp
0
290
長期・短期メモリを活用したエージェントの個別最適化
isidaitc
0
210
CoRL2025速報
rpc
1
2.5k
[論文紹介] Intuitive Fine-Tuning
ryou0634
0
130
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
84
9.2k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
[RailsConf 2023] Rails as a piece of cake
palkan
57
5.9k
GitHub's CSS Performance
jonrohan
1032
470k
Designing for Performance
lara
610
69k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
658
61k
Bash Introduction
62gerente
615
210k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
31
2.7k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
127
54k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
Transcript
MeshRIR: ⾳場分析・合成のための 格⼦点上室内⾳響インパルス応答 データセット ⼩⼭ 翔⼀1,⻄⽥智哉1 ,⽊村圭佑1 , 阿部拓実1 ,植野夏樹2
,Jesper Brunnström 1 1東京⼤学,2東京都⽴⼤学
September 9, 2021 2 Ø “MeshRIR”と呼ぶインパルス応答データセットを公開 ü 測定領域を格⼦点上に離散化したインパ ルス応答 ü
⾳場分析・合成⼿法の評価に適したデー タセット ü 2つのサブデータセット • 1⾳源から3次元直⽅体領域まで • 32⾳源から2次元正⽅形領域まで ü いくつかの⾳場分析・合成⼿法のサンプ ルコードも提供 https://sh01k.github.io/MeshRIR/
サブデータセット Ø S1-M3969 – 1⾳源から3次元直⽅体の測定領域 – 測定領域:1.0 m x 1.0
m x 0.4 m – 間隔:0.05 m – 点数:21 x 21 x 9 = 3969点 – 残響時間:0.38 s Ø S32-M441 – 32⾳源から2次元正⽅形の測定領域 – 測定領域:1.0 m x 1.0 m – 間隔:0.05 m – 点数:21 x 21 = 441点 – 残響時間:0.19 s September 9, 2021 3
測定⽅法 Ø 無指向性マイクを3軸直交ロボットに取り付けて測定 – マイクロフォン:Primo EM272J – スピーカ (S1-M3969):DIATONE DS-7
– スピーカ (S32-M441):YAMAHA VXS1MLB – 測定⽤信号:Linear swept sine September 9, 2021 4
測定条件の詳細 September 9, 2021 5 ü ファイル形式はNumpy⽤のNPYとMatlab⽤のMATがダウン ロード可能 ü 付加的なデータはJSONファイルの形式で提供
ü ⾳場分析・合成のサンプルコードも付属
⾳場の可視化結果 Ø S1-M3969を⽤いて⾳場を可視化 September 9, 2021 6 xy平⾯上の分布 y軸上のインパルス応答
⾳場補間∕再構成の評価例 Ø S1-M3969を⽤いて18個のマイク信号から領域全体を推定 September 9, 2021 7 真値 カーネル補間法 [Ueno+
2018] ガウスカーネルを ⽤いた場合 MSE: -5.8 dB MSE: -13.7 dB ⾳圧分布 誤差分布
⾳場合成∕制御の評価例 Ø S32-M441を⽤いて領域内に平⾯波⾳場を合成 September 9, 2021 8 ⾳圧分布 誤差分布 重み付きモードマッチング
[Ueno+ 2019] 多点⾳圧制御 SDR: 3.85 dB SDR: 4.65 dB 真値