论文部分内容阅读
声音是我们日常交流、传递信息、互相通信必不可少的一部分。真实环境中我们感知到的声音具有空间特性,包括方向、距离以及相应的环境信息。实际应用中,我们听到的声音通常来自耳机或扬声器等音频设备。三维音频技术旨在真实地提供自然、沉浸式的听觉体验,在虚拟现实、增强现实、双耳实验、一些娱乐系统如电影、游戏等科研和工程领域有着重要应用。 与其他三维音频重放技术如基于物理声场的波场合成技术,Ambisonics技术和环绕声系统相比,双耳技术相对实现简单同时具有较好的性能,得到广泛关注。基于扬声器的双耳重放存在扬声器和听者之间的交叉串声,需要增加串声消除系统抑制串声。本论文选择双耳技术为研究对象,研究双耳技术中扬声器重放存在的串声问题。主要研究工作及创新点包括: (1)提出了一种基于统计逼近的鲁棒串声消除算法。扬声器重放时,由于听者头部微小移动或转动等造成实际传输函数矩阵与设计串消系统时不同,降低串消系统性能。为提高串消系统的鲁棒特性,通常的做法是在空间中布置多个扬声器,每对扬声器重放不同频段。本研究中,针对实际应用中传输矩阵扰动的不确定性,借助统计分析,引入一随机矩阵表征。将传统单点串声消除算法转化成数学上统计逼近问题求解。自由场下仿真分析表明:所提算法可一定程度提高对听者头部微小移动的鲁棒性。 (2)提出了一种基于钢球模型的改进自由场串声消除算法。串消系统中串消滤波器的具体求解需要首先确定扬声器到听者双耳之间的传输函数。理想情况下,需要获得听者个性化的头相关传输函数(head related transfer function,HRTF)。个性化HRTF能够提供较好的性能,但对每个听者不现实,此外具体卷积实现时由于HRTF较长阶数计算量较大,不易于实时应用。实际中,自由场传输函数相对简单也常用于传输函数的建模,但由于未考虑听者的头部声学特性,性能有所下降。本研究中,基于听者头部的钢球模型建模,在自由场传输函数的基础上引入表征听者头部声学特性的衰减和延时参数修正自由场传输函数。客观理论分析和主观测听实验表明:提出的改进自由场串声消除算法能够取得较好的串声消除性能和声源音质的提升,同时并未显著增加计算量。 (3)分析探讨了扬声器与听者任意布置下的串声消除系统鲁棒性问题。理想情况下串声消除系统的设计是尽可能地逼近传输矩阵的逆。因此,在某些频率点传输矩阵可能出现病态,存在鲁棒性问题。现存的关于扬声器与听者鲁棒性分析都是针对扬声器位于听者两端呈对称分布。实际中由于听者移动或者如对于阵列式扬声器重放,扬声器和听者可能呈非对称分布。因此,有必要研究扬声器与听者任意布置下的串声消除系统鲁棒性问题,为实际扬声器串声消除系统设计提供理论指导。本研究,首先针对扬声器与听者任意分布,利用自由场传输函数理论推导出串声消除系统鲁棒特性的一般规律;然后从鲁棒频率、最小条件数、动态范围损失三个方面进行了仿真分析。结果表明:相对非对称分布,对称布置的扬声器串声消除系统能提供较好的三者性能折中。 本论文提出的改进串声消除算法和相关串声消除系统鲁棒性分析,对提高串声消除系统性能和指导实际中扬声器与听者配置有着重要意义。