三维音频扬声器重放串声消除问题研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wlm7411814
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声音是我们日常交流、传递信息、互相通信必不可少的一部分。真实环境中我们感知到的声音具有空间特性,包括方向、距离以及相应的环境信息。实际应用中,我们听到的声音通常来自耳机或扬声器等音频设备。三维音频技术旨在真实地提供自然、沉浸式的听觉体验,在虚拟现实、增强现实、双耳实验、一些娱乐系统如电影、游戏等科研和工程领域有着重要应用。  与其他三维音频重放技术如基于物理声场的波场合成技术,Ambisonics技术和环绕声系统相比,双耳技术相对实现简单同时具有较好的性能,得到广泛关注。基于扬声器的双耳重放存在扬声器和听者之间的交叉串声,需要增加串声消除系统抑制串声。本论文选择双耳技术为研究对象,研究双耳技术中扬声器重放存在的串声问题。主要研究工作及创新点包括:  (1)提出了一种基于统计逼近的鲁棒串声消除算法。扬声器重放时,由于听者头部微小移动或转动等造成实际传输函数矩阵与设计串消系统时不同,降低串消系统性能。为提高串消系统的鲁棒特性,通常的做法是在空间中布置多个扬声器,每对扬声器重放不同频段。本研究中,针对实际应用中传输矩阵扰动的不确定性,借助统计分析,引入一随机矩阵表征。将传统单点串声消除算法转化成数学上统计逼近问题求解。自由场下仿真分析表明:所提算法可一定程度提高对听者头部微小移动的鲁棒性。  (2)提出了一种基于钢球模型的改进自由场串声消除算法。串消系统中串消滤波器的具体求解需要首先确定扬声器到听者双耳之间的传输函数。理想情况下,需要获得听者个性化的头相关传输函数(head related transfer function,HRTF)。个性化HRTF能够提供较好的性能,但对每个听者不现实,此外具体卷积实现时由于HRTF较长阶数计算量较大,不易于实时应用。实际中,自由场传输函数相对简单也常用于传输函数的建模,但由于未考虑听者的头部声学特性,性能有所下降。本研究中,基于听者头部的钢球模型建模,在自由场传输函数的基础上引入表征听者头部声学特性的衰减和延时参数修正自由场传输函数。客观理论分析和主观测听实验表明:提出的改进自由场串声消除算法能够取得较好的串声消除性能和声源音质的提升,同时并未显著增加计算量。  (3)分析探讨了扬声器与听者任意布置下的串声消除系统鲁棒性问题。理想情况下串声消除系统的设计是尽可能地逼近传输矩阵的逆。因此,在某些频率点传输矩阵可能出现病态,存在鲁棒性问题。现存的关于扬声器与听者鲁棒性分析都是针对扬声器位于听者两端呈对称分布。实际中由于听者移动或者如对于阵列式扬声器重放,扬声器和听者可能呈非对称分布。因此,有必要研究扬声器与听者任意布置下的串声消除系统鲁棒性问题,为实际扬声器串声消除系统设计提供理论指导。本研究,首先针对扬声器与听者任意分布,利用自由场传输函数理论推导出串声消除系统鲁棒特性的一般规律;然后从鲁棒频率、最小条件数、动态范围损失三个方面进行了仿真分析。结果表明:相对非对称分布,对称布置的扬声器串声消除系统能提供较好的三者性能折中。  本论文提出的改进串声消除算法和相关串声消除系统鲁棒性分析,对提高串声消除系统性能和指导实际中扬声器与听者配置有着重要意义。
其他文献
随着无线通信的广泛应用,无线的频谱资源越来越紧张,作为主要的能够提高频谱利用率的多天线技术,受到学者和产业界的极大关注。在以IMT-Advanced为代表的未来无线通信中,多天线技
近年来,随着移动应用的发展,人们对于定位服务的需求逐渐凸显出来,使得对定位技术的研究成为一个热点。对于定位服务来说,由于存在多径效应、非视距传播等因素的影响,定位精
学位
合成孔径雷达(SAR)是一种工作在微波波段的相干成像雷达,具有高分辨率、全天时、全天候、大面积成像等优点,已经被广泛应用在国民经济和军事领域的很多方面。然而近年来随着
公路重金属污染一直是国际环境地球化学高度关注的研究热点。近年来,随着各种前沿、尖端分析技术的引入,重金属元素分析精度不断提高,检出限不断降低,这些都从各种角度有力的促进了公路重金属污染的研究。比如,有大尺度下生态系统退化机理的研究、景观结构、功能与动态变化,特别是重金属污染下景观的破碎化和全球污染物的生物地球化学循环等宏观层次上的研究;重金属污染导致的种群遗传组成上微小差异导致的微观进化之中观层次
随着通信服务发展的深入,出现了许多新问题和新矛盾,这些问题最终都会转化为客户投诉到达投诉分析部门。能够有效地分析投诉,快速的抽取出用户、分析部门或其他业务部门关注
慢性铅暴露可以引起学习记忆和认知功能的损伤,突触可塑性被认为是学习和记忆的神经生物学基础,它包括了长时程增强(long-term potentiation,LTP)和长时程压抑(long-term depres
近年来医学学科发展较快,很多理念已较以前有了不同程度的更新,对许多疾病的认识和治疗手段都有了较大变化;随着医学的进步和医院设备、设施的完善,教材再版,对医学生的培养
在纺织行业中,羊毛纤维直径是羊毛检测与分类最重要的测试指标。本文主要对基于数字图像处理的羊毛纤维直径计算方法进行了研究。主要包括:基于数字图像处理的羊毛纤维直径计
宽带声传播处理技术最早广泛应用于地声传播波形分析领域,在水声传研究中被关注的相对较少。随着声呐工作频率向低频的扩展和人们对时域波研究的深化,宽带声传播处理技术越来越