基于听觉模型的语音增强的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:roseis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文旨在探索在低信噪比条件下单声道的语音增强问题,这项工作有相当的难度但却有着极其重要的实际意义。首先回顾一些主流的语音增强方法,重点介绍了频谱减法以及各种改进方法的优缺点。人耳在噪声中提取语音信息的能力是目前各种除噪方法都不能达到的,于是从研究人耳的生理结构特点出发,提出了一套完整的听觉模型来解决语音增强问题。根据人耳的生理结构主要分为内耳(包括耳蜗)和听觉通路两大部分的特点,听觉模型也分为听觉前端系统的模拟和听觉中枢的模拟两大功能模块。 在声音从外耳传递到内耳耳蜗的过程中,人耳主要实现了声音从机械波向神经脉冲的转化过程。这里面包括了重要的基底膜频率分解特征和掩蔽效应。小波变换在时频分析上的优点已经被很好的证明,采用多种小波的混合小波包来很好的模拟基底膜特征,并运用帧同步蝶性算法解决了Mallat算法所需数据过大以及运算时间过长的问题,最后利用掩蔽效应对语音进行了动态阈值的除噪。 针对在听觉通路的神经脉冲信号传输和处理过程中,听觉皮层对语音特征的拓扑映射是相当重要的,提出了用K0honen网络来模拟听觉皮层。讨论提取什么样的语音矢量来表述语音特征以及网络训练的问题。针对噪声环境对语音映射的影响,提出了二次有监督的学习。最终,为了改善除噪语音的听觉效果,利用神经网络的联想记忆功能,对除噪后畸变的语音进行修正,给出了修正的公式。就修正这一步来说,它又符合听觉循环通路的概念。采用高斯白噪声和汽车噪声对系统进行了实验分析,从客观和主观两方面用多个度量方法来评价语音增强的效果。
其他文献
一维半导体纳米材料因其独特的物理化学性质在纳米器件中有广阔的的应用前景,研究一维纳米材料有利于研究低维系统的维度与量子限域效应对系统的电学、热学和机械等性质的影
“入园难,难于考公务员:入园贵,贵过大学收费”.rn上幼儿园难的问题不仅让众多家庭苦恼,更引起了中央相关领导的高度关注.rn2010年以来,众多关心教育发展的人士和相关教育专
该文主要介绍作者有关GaN薄膜材料缺陷的研究,主要是线形位错方面的,并讨论了线形位错对其材料性质影响方式.GaN材料中存在着大量的缺陷,但其光、电等方面的性能仍保持良好,
本文利用COM理论对新型的SH-SAW谐振器和纵向耦合谐振滤波器的结构进行了详细的讨论,并且在实验上实现了一系列单端谐振器和纵向耦合谐振滤波器。理论和实验的结果证明,利用SH-
概率统计方法是图像处理的主导方法,模糊理论和技术是当今学术界的研究热点,该文从模糊技术和概率统计两个角度对图像噪声处理展开研究,分别对灰度图像和彩色图像噪声消除进
电子型掺杂高温超导体在超导态和正常态下的自旋动力学是建立在费米面的拓扑结构基础上的。我们在t-t-J模型上使用slave-boson方法,借助于无规相近似来研究晶体的反铁磁自旋涨
本文实验研究了庞磁阻材料薄膜特性和YBCO薄膜中自旋极化准粒子的注入效应,得到了一些有益的结果。主要研究内容: 一、利用固相烧结法制备了不同成分的Nd1-xSrxMnO3大块样品
论文共分为七章.在论文的第一章中,首先介绍了软件无线电的概念及其出现的原因.随后,说明了软件无线电的关键技术和典型的体系结构.第二章,从模拟IQ收器的原理出发,介绍了多
对调频内耗仪进行了改进,使之适合毫米级单晶小样品的力学弛豫谱测量。掺Pr系列Bi-2212单晶的内耗结果显示,在130K左右存在一个内耗峰,该峰先随着Pr含量x的增加而变高,在x介于0.1
低能团簇淀积技术是80年代后期发展起来的新的团簇束流淀积技术,由于其特有的物理机制,实现了以团簇为基元来组装新材料而引起了人们广泛的关注。实验表明团簇薄膜生长的形貌和