优化RBF神经网络用于语音识别的研究

来源 :太原理工大学 | 被引量 : 17次 | 上传用户:qhjiso
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RBF神经网络具有结构简单、分类性能好、学习速度快、泛化能力强和不易陷入局部极小等优点,因此在语音识别领域得到越来越广泛的关注和应用。对于RBF神经网络来说,基函数的中心是RBF神经网络的重要参数,它们的取值对网络的性能有很大的影响。但是,传统的RBF神经网络学习算法常常收敛于局部最佳值。RBF神经网络和模糊逻辑系统能够实现很好的互补,提高神经网络的学习泛化能力。因此,为进一步改善传统RBF网络的性能,本文在前人工作的基础上提出了两种改进算法。首先,本文用具有全局搜索性能的遗传算法训练RBF神经网络来确定其基函数的中心。遗传算法中交叉概率和变异概率的选择是影响遗传算法行为和性能的关键所在,直接影响算法的收敛性。所以本文引入自然数编码的自适应遗传算法,根据个体的具体情况自适应地调整交叉概率和变异概率。用遗传算法优化的RBF网络,增强了网络的全局寻优能力,提高了网络的模式识别性能。将改进后的算法应用到语音识别系统中,实验结果表明使用该方法的识别结果优于使用K—均值聚类算法选取质心的RBF网络的识别结果。其次,本文构建了基于结构等价型模糊RBF神经网络的语音识别系统。提出了一种结构等价型模糊RBF神经网络结构和学习算法,采用五层神经网络结构来实现模糊系统的模糊化和规则推理,神经网络的所有节点和参数对应模糊系统的隶属度函数和推理过程。该网络利用模糊推理系统和RBF网络的等价特性,可以自动确定模糊规则数和隶属度函数,解决了模糊系统如何自动生成和调整隶属度函数和模糊规则的难题。本文根据待识别的词汇数自动选择模糊规则数,采用监督聚类方法和梯度下降法分两步对系统参数进行训练,其收敛速度比所有参数都用梯度下降算法训练或者隶属度函数的中心采用K-均值聚类算法学习快速得多且识别准确率高。同时与RBF神经网络算法进行了比较,实验表明了该方法具有较高的识别率和鲁棒性,以及对不同语音特征的适应性,可以作为进一步研究抗噪语音识别的基础。最后,论文引入小波变换理论,用小波函数作为结构等价型模糊RBF神经网络中的隶属度函数,实验结果表明,这种神经网络同样可以获得很好的识别效果。
其他文献
图像美学质量评估是计算机视觉领域的一大热点课题。该项研究旨在使计算机能够从人的视觉感知角度出发,自动评估图像质量高低,将图片分为“美观”和“不美观”两类。图像美学
医学内窥镜因其独特的构造能够深入患者的体内,直接观察体内胃肠道各器官的表现,从而在现代胃肠道疾病的诊断中发挥着巨大的作用。但胃肠道疾病的诊断依靠内科医师对内窥镜图
本学位论文研究课题来源于国家高技术研究发展计划(863计划)专题课题“车辆间及车辆内联网的体系结构与组网技术研究(N0.2008AA01Z205)”,在详细研究车辆自组网(VANET,Vehiclar A
IEC61850是国际标准组织发布的最新的变电站自动化系统标准,旨在统一目前各成一体的变电站自动化通信系统,提高系统的维护性、开放性和扩展性,促进电力系统网络化、信息化的发展。本文对IEC61850系列标准进行了深入的分析和研究,介绍了IEC61850标准的主要内容、主要技术特点,变电站配置描述语言(SCL)等内容,并提出对标准的理解。分析OPNET网络仿真软件的特点及应用,对过程总线和变电站总线
随着移动设备、大容量存储设备和互联网服务的日益普及,人们可以更加方便地生成、存储、传输和分享图像、视频等多媒体数据。图像数据的爆炸性增长不仅给我们带来了大量的资
本课题来源于中国航天科工集团23所某型号雷达电子维修车的研发项目。随着装备复杂性的不断提高,自动测试系统在现代装备系统中的作用已经不容忽视,它贯穿于装备的全寿命周期,承
随着图像信息的日益普及,图像在很多领域都有着非常重要的作用。但是图像在采集、获取以及传输的过程中,往往要受到不同噪声和不同程度的污染,为了后续更高层次的处理,很有必
光声技术是一种高灵敏度的无损伤检测技术,近年已成为一个研究热点。光声技术在生物医学领域中的应用为临床诊断提供了一种新的研究手段—光声层析成像。光声层析成像结合了