加性噪声环境下语音识别的鲁棒性研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:hongniba3493
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为人机语音通信的关键技术和人工智能研究的重要方向,语音识别技术具有重要的科学研究和应用价值。尽管近十多年来,关于语音识别的研究取得了较大的突破和进展。但是针对于噪声环境下,语音识别系统性能急剧下降的问题,尚未有较好的解决方案。为增强语音识别系统的实用性,必须解决不同噪声环境下的语音识别问题,即语音识别的噪声鲁棒性。本文对目前语音识别的主要模型及相关算法进行了研究,特别是针对语音识别中的噪声鲁棒性问题,从信号空间、特征空间和模型空间三个方面进行了深入的研究,并基于它们各自的优点,提出将最小均方误差对数谱幅度估计语音增强算法与MVN特征规整相结合的SSECFN算法,以及特征补偿与MVN特征规整相结合的识别算法,并总结出MVN最佳结合方案。以提高语音识别系统实际应用的性能。本文的主要工作和贡献在于:   1、对目前语音识别的主要模型及相关算法进行了分类讨论与研究,分析了国内外研究现状及存在问题。   2、对噪声鲁棒性语音识别技术进行了相关研究,并根据噪声环境下语音识别系统的构成,将噪声鲁棒语音识别技术按照信号空间,特征空间和模型空间的识别技术进行了分类总结。   3、提出了短时谱估计与特征规整结合的SSECFN噪声鲁棒性语音识别算法,该算法针对采用最小均方误差对数谱幅度谱估计语音增强后,语音仍然含有残余噪声的问题,采用MVN特征规整进一步改善增强语音与纯净语音间不匹配的方法,以获得更好的性能。   4、提出了特征补偿与MVN特征规整相结合的噪声鲁棒性语音识别算法,并研究了最佳结合方案。
其他文献
数控机床是高新技术产业不可缺少的基础装备,尤其是随着科技的进步,对复杂零件的加工精度和效率的要求日益提高。为了满足科技发展的需要,数控技术也在向开放式的方向发展。对嵌
学位
成像设备及各种图像编辑软件的大规模使用,使得数字图像篡改现象经常发生,因此,鉴别数字图像的真伪显得尤为重要。传统的数字图像主动防伪鉴别技术,由于依赖预签名提取或预嵌
遥感数据的处理是遥感卫星系统的重要组成部分,一般,处理流程主要包括:遥感数据的接收、影像分景、格式化输出、辐射校正、几何校正以及数据存储与传输工作。   线阵CCD影
学位
研究背景:髓母细胞瘤是儿童最常见的恶性脑肿瘤,好发于10岁以下的儿童,绝大多数生长于第四脑室的小脑蚓部,依赖血管生成为组织提供氧气和营养,肿瘤血管分布不均、杂乱无章、缺乏基底膜、通透性高,从而促进了肿瘤浸润性生长,为肿瘤的播散转移提供了途径。目前以神经外科显微手术为主,放疗、化疗为辅的综合治疗手段日臻成熟,但要做到对颅内高度浸润的肿瘤进行根治性治疗仍然十分困难。同时大剂量的放、化疗均对患者有毒副作
RPC模型是当前国外高分辨率卫星IKONOS、Quickbird、Cartosat-1(IRS-P5)采用的通用传感器模型,它利用有理多项式参数代替遥感平台与传感器自身的物理成像参数,在对自身技术信
学位
近年来,遥感数据的备份与容灾是数据存储与安全领域内备受关注的问题。目前正在建设的“遥感数据异地备份系统”是中国科学院对地观测与数字地球科学中心的一个重大科学项目,
学位
论文介绍了便携式多通道电化学分析仪器的设计研究。结合现有的电化学分析仪器的应用背景和技术特点,从系统功能和仪器指标出发,详细说明了便携式多通道电化学分析仪器的设计
学位
上海光源(ShanghaiSynchrotronRadiationFacility,SSRF)为先进的第三代中能同步辐射光源。上海光源光束线的控制系统用于控制和监测光束线各设备的运行状态,记录和分析各种控
学位
嵌入式技术是20世纪70年代发展起来的新技术,随着嵌入式系统研究和应用的不断深入,嵌入式系统与各个行业的具体应用开始紧密结合,在我国国家现代化建设进程中发挥了巨大的推进作
学位
近无损图像压缩技术是一种既能限制每个像素重建的误差又有较高的压缩率的技术。随着医学成像、卫星通信、遥感、指纹识别等技术的发展,近无损压缩技术受到越来越多的研究人