论文部分内容阅读
该论文讨论了语音信号的非线性处理方法.特别地,引入了混沌、神经网络等近年来 发展起来的非线性理论,主要研究了混沌时间序列分析技术及其在语分析与识别中的应用,以及混沌神经网络在语音识别和语音保密通信中的应用.首先,作者深入地研究了混沌时间序列分析技术的一些重要的课题,即混沌时间序列的建模、预测及噪声抑制问题;着重研究了Farmer&Sidorowich,Linsay,和Nauone&Ceccatto分别提出的三种典型的混沌时间序列局域线性预测方法.该论文的结果将有助于研究者在实际中选择合适的混沌时间序列的预测模型.考虑到现实物理背景下噪声对混沌时间序列预测建模的重大影响,提出了被加性高斯白噪声污染的混沌时间序列中估计混沌系统参数并同时进行噪声抑制的一种新方法.这种新方法把对混沌时间序列的参数估计和噪声抑制看作是一种最小过程,并利用了最速梯度下降方法解决.接着,基于语音信号是一个存在产生混沌的机制的非线性过程这一事实,利用非线性的混沌时间序列分析技术对汉语语音进行了细致的分析.在研究汉语语音的状态空间重构问题中,主要讨论了语音延迟坐标重构中延迟时间和最小嵌入维这两个参数的选择,并着重比较了语音的延迟坐标重构和奇异值分解(SVD)重构方法的性能,通过数值模拟发现,SVD方法更适合于语音状态空间的重构.进一步研究了混沌时间序列分析技术在语音非线性特征提取方面的应用.着重探讨了语音的分形特征,对语音时域波形的分形维数和重构吸引子的多重分形维数的算法进行了改进,并引入语音的短时波形分形维数和时变多重分形维数概念,以进一步刻划语廛的局部分形特征.以Aihara型混沌神经元为基本单元,作者提出了一种新的多层混沌神经网络(MLCNN)结构.利用变分的方法,引入Lagrange乘子,把BP算法推广到混 沌神经网络的学习中,并推导出了相应的学习算法.把MLCNN用于语音识别,提出了一种基 于MLCNN的语音识别方法.针对混沌自组织映射(CSOM)算法在矢量量化中的缺陷.作者提出 了一种改进的混沌自组织映射(MCSOM)算法.最后,作者采用混沌神经网络作为离散的混沌 系统,探讨了混沌神经网络的同步问题,并利用混沌神经网络的同步提出了一种新的数字语音保密通信系统方案.鉴于混沌神经网络结构较为复杂,且不易分解的特点,基于反馈控制混沌原理,该论文提出一种拳的离散系统混沌同步方法--非线性反馈控制混沌同步方法来同步两个混沌神经网络.针对传统的混沌遮掩方法由于发射和接蛋端的驱动信号不同而导致恢复出来的信息存在误差的缺点.提出了一种改进的混沌遮掩方法,即有用信息除了去驱动接收端外也反馈到发射端,这样将保证发射端与接收端完全同步.采用改进的混沌神经网络的同步该论文提出了一种新的数字语音保密通信系统方案.