基于平行子状态隐马尔可夫模型的噪声鲁棒语音识别研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:yzhyzhyzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,语音识别系统在实验室安静环境下已经达到相当高的识别率,然而当系统工作在背景噪声环境下,由于输入语音受到噪声污染,系统识别性能会急剧下降。噪声鲁棒性问题已经成为语音识别系统实用化的主要瓶颈,是语音识别技术当前面临的主要挑战之一。 论文研究的目的是提供一套具有实用价值的完整噪声鲁棒语音识别解决方案,满足实用的两个关键要求:不需要重新训练语音模型、不需要人为干预调整;同时具有良好的噪声鲁棒识别性能。论文在对已有噪声鲁棒语音识别方法研究的基础上,提出了一套基于平行子状态隐马尔可夫模型的噪声鲁棒语音识别方法,并给出了融合该方法语音识别软件设计方案。 本文主要研究工作(○)和创新性贡献(●)如下: ○建立了基于声韵母模型的中文语音识别平台。 ○研究了当前主要的噪声鲁棒语音识别方法,包括:鲁棒特征、谱减、自适应和并行模型结合等方法,并对其鲁棒识别性能进行了实验测试和综合对比,为新方法的性能比较提供了分析依据。 ●提出了一种基于前后向差分动态参数的特征矢量构造方法MFCCfwDbwD,用于解决原有的MFCCDA特征矢量在并行模型结合中其动态特征参数无法逆变为时序静态矢量的问题。 ●提出了一种“状态间全转移”的多状态背景噪声模型,用来描述非平稳时变特点的复杂背景噪声,该噪声模型是生成平行子状态隐马尔可夫模型的基本条件。 ●在隐马尔可模型中引入了平行子状态的概念,提出了一种具有平行关系子状态的隐马尔可夫模型结构用作纯净语音模型和多状态背景噪声模型结合后的声学模型,使用该模型进行噪声鲁棒语音识别。 ●针对平行子状态隐马尔可夫模型在识别解码搜索时的子状态处理,给出了三种不同的识别解码策略:子状态最大似然解码策略、联合转移子状态最大似然解码策略和子状态输出概率求和解码策略。 ●给出了基于“增加树”法和上文相关声学模型的识别搜索网格优化方法,用于减少识别搜索网格的前向冗余。 ○给出了融合本文提出的平行子状态隐马尔可夫模型噪声鲁棒方法的语音识别软件设计方案。 本文提出的基于平行子状态隐马尔可夫模型的噪声鲁棒语音识别方法,在各种噪声环境下都大幅提高了语音识别的准确率,鲁棒识别效果非常突出,相对基线系统平均识别准确率提高达25﹪,明显优于其它噪声鲁棒识别方法,特别是对于非平稳时变噪声也具有良好的鲁棒性能,并且该方法不需要重新训练语音模型和人为干预调整,使其实用优势更为明显。
其他文献
电力设备的安全性和可靠性,在很大程度上是由其绝缘性能决定的。据统计,在1992~2001年间,我国发生的电气火灾起数,占总火灾起数的26%。而在这些电气火灾中,又有近一半是由绝缘事故引
本文通过对荣华二采区10
期刊
学位
数字水印技术是近几年发展起来的新兴的研究领域,目前的研究大多集中于版权保护的稳健水印,也就是具有强鲁棒性的数字水印。同时,数字水印技术还可以用于保密通信领域,并且具有广
北斗二代卫星导航系统于2012年底正式提供亚太区域服务,其北斗三代卫星目前正在组网阶段,预计在2020年正式提供覆盖全球的导航、定位和授时服务。然而,当前阶段,单北斗系统观测卫
本文对IR-UWB技术中存在的问题进行了相应的研究和探讨。文章的主要研究内容包括超宽带信号接收处理优化技术研究和码分多址干扰误码性能分析两个部分,其中第一部分主要考虑针
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
在通信技术发展迅猛的今天,移动通信已经成为人们日常生活中必不可少的一部分。卫星通信是移动通信中重要的一部分,其中天线是卫星通信的一项关键技术。因为受到电离层的法拉第
学位
本文通过对荣华二采区10
期刊