论文部分内容阅读
随着人们对信息获取的移动性需求不断增加及电话网络的普及,语音识别技术在通讯领域的应用越来越广泛,因而电话语音识别技术已成为目前一个重要的研究课题。电话语音识别技术的关键问题就是如何提高电话语音识别系统的抗噪声能力和通道自适应能力。本文以提高电话语音识别系统的识别率为目的,从特征提取和模型改进这两大方面进行了研究。论文首先论述了语音信号的非线性和混沌性,阐述了采用非线性理论处理语音信号的理论依据。接着论文对提取语音信号非线性特征的相空间重构(RPS)法进行了深入的分析,对相空间重构的时间延迟和嵌入维数的确定方法进行了研究,提出了采用改进平均位移法后得到的联合平均位移法来确定时间延迟。然后,对采用相空间重构法提取的语音信号非线性特征(RPS特征)进行了研究,提出采用由RPS特征和MFCC特征相结合得到的新的特征RPSMFCC作为系统中语音特征。最后,在详细分析电话信道的影响和RPS特征的时域性的基础上,采用神经网络自适应噪声抵消系统与RASTA滤波去除噪声相结合的方法去除信道中的噪声。在模型空间上,本文深入研究了隐马尔可夫模型和全局背景模型,并将全局背景模型的思想引入隐马尔可夫模型,提出了HMM-UBM的模型。论文用Matlab程序对文中提出改进的特征提取方法和模型进行了实验仿真,仿真结果表明识别系统达到了较高的识别率。