Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Shoichi Koyama
September 09, 2021
Research
260
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Presentation slides for ASJ2021A.
Shoichi Koyama
September 09, 2021
More Decks by Shoichi Koyama
See All by Shoichi Koyama
Weighted Pressure Matching Based on Kernel Interpolation for Sound Field Reproduction
sh01k
0
310
Binaural reproduction from multiple microphone arrays
sh01k
0
230
Sound Field Reproduction With Weighted Mode Matching and Infinite-Dimensional Harmonic Analysis: An Experimental Evaluation
sh01k
0
270
[ASJ2020A: 2.1.15] 音場制御におけるスピーカ・制御点配置最適化法の比較評価
sh01k
0
360
Other Decks in Research
See All in Research
人間中心の意思決定支援AI
yukinobaba
PRO
6
2.9k
老舗ものづくり企業でリサーチが変革を起こすまで - 三菱重工DXの実践
skydats
0
190
「行ける・行けない表」による地域公共交通の性能評価
bansousha
0
160
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
870
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
230
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
1.4k
東京大学工学部計数工学科、計数工学特別講義の説明資料
kikuzo
0
500
多様なデータを許容し学習し続ける模倣学習 / Advanced Imitation Learning for VLA
prinlab
0
220
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
260
CVPR2026論文紹介_VLMにとって良いvision encoderとは何か?Rethinking Model Selection in VLM Through the Lens of Gromov-Wasserstein Distance
kobayashi31
1
130
The mathematics of transformers
gpeyre
0
330
Language and AI
ayaniwa
0
130
Featured
See All Featured
The Curse of the Amulet
leimatthew05
1
13k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
170
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
210
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
430
Java REST API Framework Comparison - PWX 2021
mraible
34
9.4k
WCS-LA-2024
lcolladotor
0
650
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
1
1.7k
KATA
mclloyd
PRO
35
15k
Claude Code のすすめ
schroneko
67
230k
Transcript
MeshRIR: ⾳場分析・合成のための 格⼦点上室内⾳響インパルス応答 データセット ⼩⼭ 翔⼀1,⻄⽥智哉1 ,⽊村圭佑1 , 阿部拓実1 ,植野夏樹2
,Jesper Brunnström 1 1東京⼤学,2東京都⽴⼤学
September 9, 2021 2 Ø “MeshRIR”と呼ぶインパルス応答データセットを公開 ü 測定領域を格⼦点上に離散化したインパ ルス応答 ü
⾳場分析・合成⼿法の評価に適したデー タセット ü 2つのサブデータセット • 1⾳源から3次元直⽅体領域まで • 32⾳源から2次元正⽅形領域まで ü いくつかの⾳場分析・合成⼿法のサンプ ルコードも提供 https://sh01k.github.io/MeshRIR/
サブデータセット Ø S1-M3969 – 1⾳源から3次元直⽅体の測定領域 – 測定領域:1.0 m x 1.0
m x 0.4 m – 間隔:0.05 m – 点数:21 x 21 x 9 = 3969点 – 残響時間:0.38 s Ø S32-M441 – 32⾳源から2次元正⽅形の測定領域 – 測定領域:1.0 m x 1.0 m – 間隔:0.05 m – 点数:21 x 21 = 441点 – 残響時間:0.19 s September 9, 2021 3
測定⽅法 Ø 無指向性マイクを3軸直交ロボットに取り付けて測定 – マイクロフォン:Primo EM272J – スピーカ (S1-M3969):DIATONE DS-7
– スピーカ (S32-M441):YAMAHA VXS1MLB – 測定⽤信号:Linear swept sine September 9, 2021 4
測定条件の詳細 September 9, 2021 5 ü ファイル形式はNumpy⽤のNPYとMatlab⽤のMATがダウン ロード可能 ü 付加的なデータはJSONファイルの形式で提供
ü ⾳場分析・合成のサンプルコードも付属
⾳場の可視化結果 Ø S1-M3969を⽤いて⾳場を可視化 September 9, 2021 6 xy平⾯上の分布 y軸上のインパルス応答
⾳場補間∕再構成の評価例 Ø S1-M3969を⽤いて18個のマイク信号から領域全体を推定 September 9, 2021 7 真値 カーネル補間法 [Ueno+
2018] ガウスカーネルを ⽤いた場合 MSE: -5.8 dB MSE: -13.7 dB ⾳圧分布 誤差分布
⾳場合成∕制御の評価例 Ø S32-M441を⽤いて領域内に平⾯波⾳場を合成 September 9, 2021 8 ⾳圧分布 誤差分布 重み付きモードマッチング
[Ueno+ 2019] 多点⾳圧制御 SDR: 3.85 dB SDR: 4.65 dB 真値