论文部分内容阅读
图像分类技术一直都是计算机视觉领域的研究热点。近年来,深度学习算法在图像分类方面取得了突破性进展,通过建立层级特征自动提取模型,得到更准确且接近图像高级语义的特征。卷积神经网络(CNN)是一种识别率很高的深度学习模型,能够提取具有平移、缩放、旋转等不变性的结构特征。但CNN模型大量的参数需要上万张有标记数据集去训练,并且随着CNN模型层数的增加,在反向调参时梯度会逐渐弥散,导致模型底层参数更新缓慢且难以达到最优,从而影响图像分类准确率。为提高CNN模型在小标记量数据集上的适用性,考虑到受限玻尔兹曼机(RBM)无监督学习的优势,本文提出一种基于CNN与RBM混合模型R-CNN迁移学习的图像分类方法。该方法首先迁移大数据集上预训练好的参数去初始化小目标集的CNN模型,然后使用RBM代替CNN中的全连接层,在小目标集上无监督重训练RBM层,最后使用少量有标记数据对整体混合模型有监督微调。本文R-CNN模型改进了传统CNN模型的结构和训练方式,加入的RBM层既可以全连接所有特征maps获得丰富的不变性特征,还能充分无监督参数训练,获得目标集本身的高阶统计特征,提高了小数据集上CNN模型图像分类的准确率。接着为解决CNN模型底层参数难以达到最优的问题,本文提出改进的卷积编码CE算法来逐层贪婪训练CNN各卷积层。本文CE算法对输入特征有效卷积编码,对输出特征全卷积解码来重构原输入,以最小化重构误差为目的训练卷积滤波器。改进的CE算法中加入了层间映射关系、权重正则化及附加变量,通过参数交替迭代优化的方式,使卷积滤波器快速收敛到最优。结合上面的R-CNN混合模型,基于改进CE算法的ER-CNN混合模型可以扩展到更深层数上,进一步提高CNN模型图像分类的准确率。本文在MNIST、COIL-20及CIFAR-10数据集上进行了多次验证,实验结果表明,本文提出的R-CNN混合模型可以有效地应用在小数据集上,且改进的CE算法能在CNN模型层数增加时取得较好的分类效果。