深度信念网的无监督学习算法研究与应用

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:chm200630990203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络(Deep Neural Network,DNN)模拟哺乳动物大脑感知信号的多层结构,建立多个隐含层,层层提取输入信号的不同特征,并在输出层形成神经网络对输入信号的认知。深度信念网(Deep Belief Network,DBN)受人脑认知和推理过程的启发而被提出,是DNN最主要的实现方式之一。DBN较好的模拟人脑感知信息和处理信息的深层结构,在训练中将特征提取过程和认知过程结合,实现对大量数据快速有效学习,在图像识别、声音辨识、自然语义理解及多个回归和预测任务中得到关注和研究。  深度信念网在理论和学习算法方面仍存在许多难以解决的难题,如果网络规模设置不当,或者当网络训练过度,隐含层难以实现对输入数据特征的有效提取,使得训练容易出现过拟合,另外,由于传统网络使用离散型传递函数,难以实现对连续型数据的建模和预测,并且隐含层神经元间的协同作用易导致精度差、耗时大等问题。针对这些问题,文中首先对深度信念网的无监督学习进行分析和改进,提出连续型深度信念网,并改进训练阶段传递函数,最后提出无监督训练的隐含层神经元结构自组织深度信念网,提高了网络无监督学习的特征提取能力。将其应用于图像处理,污水水质分类,大气数据预测实验中,验证了算法的有效性。  论文主要工作如下:  1)无监督特征学习分析  针对DBN网络隐含层层数难以选择问题,首先从数学角度和生物学角度分析了随机初始化的梯度下降算法导致网络训练失败的原因,并通过实验进行验证。证明了RBM重构误差与网络能量的正相关定理,同时根据隐含层和误差的关系,提出一种基于重构误差的判断方法,用于确定网络深度,在训练过程中自组织的训练网络,使其能够以一种接近人类处理问题的方式解决人工智能问题。手写数字识别的实验表明,该方法能够有效提高运算效率,降低运算成本。  2)连续型深度信念网的设计  针对一般深度信念网学习连续数据时预测精度较差的问题,提出一种双隐层连续型深度信念网。该连续型深度信念网首先对输入数据进行无监督训练,提出无监督训练的连续型传递函数,将网络可视层和隐含层神经元数值范围扩大,使得网络利用连续型传递函数实现数据特征提取,设计基于对比散度算法的隐层权值训练方法,并通过误差反向传播对隐层权值进行局部寻优。同时,给出了稳定性分析,证明了网络稳定性定理,得到稳定条件,保证训练输出结果稳定在规定区域。最后,利用Lorenz混沌序列、CATS序列实验对连续型深度信念网进行测试,实验结果表明,连续型深度信念网具有结构精简,收敛速度快,预测精度高等优点,能够实现对连续型数据的预测和建模。  3)正则化强化深度信念网的设计  传统深度信念网中,如果训练参数或规模设置不当,网络不能有效提取图像特征,使得训练得到的网络对未知数据的反应不灵敏,导致误差较大,过拟合现象严重。文中提出一种正则化强化的深度神经网络,在传递函数中引入正则化强化项,使得网络在训练过程中智能分析连接权值的变化趋势,降低次要权值在训练过程中的作用,调节训练过程中训练误差减小与权值增大之间的平衡,保证网络中稀疏连接特性,抑制过拟合现象的发生,提高网络泛化能力,增加对数字图像的识别准确度。通过MNIST手写图像对所提网络进行验证,实验结果表明该网络的次要权值在训练中被自动减少,使得图像特征提取能力得到改善,且具有运算速度快,精度高的优点。  4)无监督学习的结构自组织算法设计  一般连续型深度信念网络由于隐含层神经元间存在协同作用,容易对训练组样本的模式进行过于精确的训练,将训练组每个样本看成独立的个体,忽略了样本作为整体一部分所具有的相互关系,以至于将其中的误差信息和错误特征也一并学习。文中提出一种无监督训练过程的结构白组织型深度信念网,提高无监督学习特征提取能力和连续型数据预测精度。设计神经网络无监督训练的Dropout结构自组织机制,降低特征检测器协同作用,提高网络特征提取能力和泛化能力,设计基于对比散度的快速训练方法,并使用误差反传局部寻优,保证网络稳定。将该自组织型连续深度信念网应用于图像特征提取实验和大气CO2序列预测实验,结果表明所提网络的隐含层神经元间的协同作用得到有效抑制,并且具有泛化能力强,收敛速度快的优点。
其他文献
图像匹配作为图像处理及模式识别领域的一个基础问题,在光学制导、遥感测量、机器视觉、目标识别以及工业检测等领域都有广泛的应用。图像匹配的难点在于图像本身复杂多变、图
本文对平行双轮电动车的控制系统进行研究,对控制策略进行了比较选择,建立了控制系统的数学模型,并根据线性系统理论,在Matlab环境下设计了状态反馈控制器并进行了控制仿真,仿真结
由于间歇过程具有高附加值、小批量、多品种、系列化等特点,所以间歇过程被广泛应用于与人们息息相关的生物制药、食品加工、染料和香料制造等领域。为了保证产品的质量和减
学位
入侵检测是一项重要的网络安全技术,已得到了广泛应用,对这一技术的研究也日益深入。通过构建动态的安全循环,入侵检测可以最大限度提高系统的安全性,减少安全威胁对系统带来的危
作为可再生能源的风能资源以其蕴量巨大,分布广泛,没有污染等优势而在各国发展迅速,加快开发利用风能已成为全球能源界的共识。 风能的利用主要是发电,其开发利用是解决常
无轴承电机是一种能够同时实现转矩绕组控制与悬浮绕组控制的新型电机。与传统的磁悬浮电动机的悬浮机理不同,它利用了磁轴承结构和交流电动机定子结构的相似性,把转矩控制绕组
随着企业信息化要求越来越高,企业的综合信息集成是发展的必然趋势。底层的控制系统发展得很成熟了,并已广泛应用到各行各业,为实现生产的自动化打下了良好的基础;上层的管理软件
近年来近扩散光断层扫描(DOT)研究越来越受到人们的广泛关注。在医学成像上,近红外光被用于探测生物组织,意在恢复光学参数的空间分布,如散射系数和吸收系数,并且把这些参数以图
脑的功能具有两个基本的组织原则:功能分化与功能整合。人脑总是作为一个网络来完成其功能的。因此,从网络的角度来研究人脑的功能无疑是非常必要的。此外,越来越多的研究已经表