论文部分内容阅读
利用机器学习算法处理数据分类任务已经研究多年,这期间涌现出很多经典有效的算法,如K-means,SVM,梯度下降算法等。这些算法广泛应用于数据分类、数据挖掘、图像识别、医学成像、雷达探测等商业、工业、医疗,军事等领域中。由于使用的环境极其广泛复杂,导致数据分类任务一直是计算机学科领域最具挑战性的任务之一。随着数据分类任务复杂程度的增加,以深度学习(Deep Learning)为基础的分类算法开始逐渐被用于大数据挖掘、图像处理、模式识别等任务,想比于传统分类算法,这些算法能够自动发现数据内部的一些结构或特征,并且通过这些结构和特征完成数据分类任务。本文围绕深度学习算法中各类算法进行研究,并且以其中最核心的DBN(深度信度网络)模型为核心进行了深入分析和研究,并提出了一种基于T-RBM(T-RestrictedBoltzmann Machine)(T型受限波兹曼机)的DBN分类算法,主要贡献如下:(1)对当前主要的机器学习算法进行了研究和分析,根据这些学习算法的特征将它们分为有监督学习算法和无监督学习算法两类进行讨论,并分析了其优缺点,根据分析结果,引出深度学习分类算法并对其进行深入研究。(2)在传统分类算法的基础上,本文对基于受限波兹曼机(Restricted BoltzmannMachine)简称RBM进行了深入研究和分析,分析结果表明,相比于其他深度学习算法,基于RBM随机分类模型实现层叠结构更容易,可以对数据进行逐层抽象,对数据的异常处理更完善,所以本文选择对基于RBM的深度学习算法进行研究,但是基于RBM的算法也存在一些问题,其中最显著的问题是参数(隐含神经元数、神经网络层数)调整困难,本文针对这一问题,对RBM进行改进研究。(3)针对基于RBM的DBN网络参数调整困难的缺点提出T-RBM算法,基于T-RBM的DBN算法主要有两点创新。首先,对于隐含神经元数的预测,本文提出了通过计算信息熵预测数据所含信息内容的大小,从而推荐出隐含层单元数量;其次,提出T型RBM网络结构,该结构可以有效的对数据噪声进行去除并逐层提取特征,这两方面的改进旨在提高分类的精确度,减少特征提取的训练时间。(4)在Matlab下对基于RBM的DBN算法和基于T-RBM算法的DBN分类网络进行了仿真,仿真结果表明在相同样本和一定条件下,基于T-RBM的DBN分类网络的分类误差率较经典DBN网络(400隐含单元)情况下的分类误差率平均降低约2%;训练时间较经典的DBN网络提高了大约10秒。通过数学推导和实验分析可知,基于T-RBM算法的DBN分类网络模型可以有效的减少了不必要的计算时间,并且通过减少噪声提高了分类网络的准确性。仿真结果表明了基于T-RBM结构的DBN分类网络在实际分类任务过程中的优势。