远场麦克风阵列语音增强技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:fanrongcheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能的快速发展,语音作为人机交互的重要入口受到了广泛关注,国内外对于语音交互的研究又掀起了一个新的高潮。麦克风阵列利用了语音信号的空间信息,比单通道语音信号有更多的空时信息,具有更高的增益、波束灵活性和抑制噪声能力强等优点。广义旁瓣消除(Generalized Sidelobe Cancelling,GSC)算法把波束形成中的约束问题转化为无约束问题且不需要估计噪声的先验信息,在工程中应用广泛。然而,在实际的应用场景中,由于存在麦克风不匹配、时延估计不准、期望方向误差和混响等问题,在下支路会有期望语音信号的泄露,从而导致在自适应噪声消除模块会发生期望信号对消的问题。此外,在语音增强的过程中,会引起部分语音特征的失真,降低语音识别系统的噪声鲁棒性和识别率,需要对语音信号进行特征增强。本文主要研究了鲁棒GSC自适应波束形成和语音特征增强算法,主要研究内容如下:首先,针对传统的GSC算法在自适应噪声相消时容易发生期望信号对消,且在上支路采用传统固定波束形成算法使得GSC输出信号鲁棒性较低的问题,本文提出一种改进的鲁棒GSC算法。在自适应噪声消除模块中,采用信号的相干性和能量比来联合控制自适应噪声相消器系数的更新,且在上支路采用鲁棒的超指向波束形成算法。提出的改进算法不仅有效地减少了期望信号的对消问题,还进一步提升了算法的鲁棒性和低频特性。其次,针对远场麦克风阵列语音识别中由于噪声影响导致语音特征失真的问题,本文深入分析了信号特征域和基于信号处理的语音特征增强,将多通道语音存在信息融入维纳滤波语音特征增强。相对传统的维纳滤波特征增强算法,改进算法能进一步抑制GSC输出信号的残留噪声,从而提高语音识别系统的噪声鲁棒性和识别率。最后,根据真实场景下录制的多通道语音数据仿真表明,本文提出的基于相干性和能量比的鲁棒GSC自适应波束形成算法,以及基于多通道语音存在的特征增强算法能够有效地保持期望信号不失真,同时提升识别系统的噪声鲁棒性和识别率。
其他文献
空间向量的引入,有效降低了立体几何问题的思维难度,使有关问题的求解程序化.高考对立体几何的考查,侧重于位置关系与数量关系,而数量关系中的“距离”问题主要有:两点间距离;点线距
高等院校的三大功能是培养人才、科研和服务社会,如何正确处理好培养人才、发展科学和服务社会三个社会职能的关系是服务地方的前提,不同的高职院校之间存在差异性,高职院校应该
数学教学离不开对典型例题、习题讲解、探究的过程,对习题深入探究能激发学生的解题兴趣,提高解题教学的效率,是值得研究的一个重要课题.实践让我们深切地体会到:在课堂教学中实施
过去的一年,云南社院坚持正确的政治方向,在教学、科研、行政管理、校园建设和加强队伍建设方面取得可喜成绩;面向新世纪的头年,要高举邓小平理论旗帜,认真贯彻落实中央统战
2009年,水利会计学会的工作将按照七届常务理事会第二次会议研究通过的年度工作计划,围绕水利财务管理工作的热点和难点及重点工作,认真开展相关工作。
在技术发展进程中,通常能够划分为三部分,一是自动化技术形成,二是局部自动化,三是综合自动化。该技术的发展动力可以满足社会需求,通过自动化技术发展可以体现出现代技术与
随着现代化工过程对生产质量的诉求不断提高,先进传感器设备和测量技术被引入到复杂的化工控制系统中,获得化工过程中越来越详细的过程数据信息,但是对提高生产质量的一些关
拒绝“电子黄毒本刊记者力展青春期是未成年人从幼稚走向成熟的转折点,是最危险的时期。可是,前一段时间,大量含有淫秽、色情内容的VCD片和电脑软件充斥街头,购买者很多是在校的中小
背景与目的:目前,在我国居民死因中排首位的疾病是脑卒中[1]。在所有的卒中类型中,60%至80%都为缺血性脑卒中[4]。经过大量研究证明,对于急性脑梗死(acute ischemic stroke,AIS)而言超早期血管再通的首选治疗方法为静脉溶栓,因为时间窗限制,能在有效时间内到达医院并接受静脉溶栓的患者十分有限。目前我国AIS患者静脉溶栓率较低,导致这一现状的因素较多,AIS静脉溶栓的不良预后
为进一步做好农业水价综合改革暨末级渠系改造试点工作,我厅于7月1日在舒城县组织开展农业水价综合改革暨末级渠系节水改造试点第三阶段培训工作,各试点县(区)水利局负责领导及业