论文部分内容阅读
多通道声场重建(Sound field reproduction,SFR)系统主要是利用扬声器阵列在目标区域内实现准确的期望声场重建,旨在使听音者获得“声”临其境的听音体验。该类系统具有最佳听音区域广、重放声场方位感强等优点,可以广泛应用于影院、演讲大厅和音乐会现场转播等诸多场合。近年来,物理声场重建成为空间音频领域的研究热点,但是在如何利用更少的传声器和扬声器实现更准确的声场录制和重建等方面仍有待完善。本文主要从压缩感知的角度对空间声场录制、重建和早期房间传递函数(Early part of the room transfer function,eRTF)插值三个方面进行了深入研究,主要内容和创新之处概括如下: (1)提出了一种基于压缩感知的空间声场录制方法,称为稀疏分解法。该方法包括单观测向量模型和多观测向量模型两种信号重构形式。仿真分析了声源数量和传声器数量等不同参数设置对算法性能的影响。结果表明,稀疏分解法能够利用少量的传声器实现准确的宽带声场录制,性能优于柱谐函数展开法。 (2)提出了一种频域块稀疏(Block sparse,BS)声场重建方法。该方法解决了LASSO方法不能对整体发声扬声器数量进行约束的问题,并且能够利用少量的扬声器在欠采样情况下实现准确的期望声场重建,优于最小二乘法(LS)。另外,作为一种次级声源选择方法,BS还可以与LS结合得到两阶段的SFR方法BS-LS。与单阶段的频域LS,LASSO和BS相比,BS-LS方法的声场重建误差更低。 (3)提出了一种基于Group LASSO(GL)的时域声场重建方法。该方法实现了对时域发声扬声器数量和位置分布的优化,在数学上等价为一个带l2,1范数约束的最小化问题,可由块坐标下降法进行迭代求解。与BS方法类似,GL方法也能够利用少量扬声器实现准确的期望声场重建,并且其对应的两阶段SFR方法GL-LS能够利用更低阶的FIR滤波器实现更准确的平面波或球面波声场重建,优于频域BS-LS方法。 (4)提出了基于空间网格(SG)模型、平面波(PW)模型和球面波(SW)模型的早期房间传递函数稀疏插值方法。基于SG模型的块稀疏方法SFBS和MFBS在理想情况下具有良好的插值性能,其中MFBS方法对目标源位置预估计偏差更鲁棒。与SG模型相比,基于PW模型和SW模型的eRTF稀疏度相对略高,但是其字典矩阵规模小,计算复杂度低。本文对基于上述模型的各eRTF插值算法进行了仿真分析,并且对PW模型和SW模型进行了实验验证。结果表明,MFBS方法能够利用包含少量传声器的随机阵列实现准确的宽带eRTF插值,优于基本稀疏插方法。