论文部分内容阅读
图像分类的准确性关系到用户图像检索时的体验,传统的图像分类方法适合处理少量数据,分类准确度较低。随着多媒体技术的发展,日益增长的图像数据给图像分类技术带来了新的挑战。深度学习技术的出现顺应了大数据时代要求,使得图像特征提取不再依靠底层特征组合变换等受人为因素影响较大的提取方法,它克服了图像底层像素与高层语义的鸿沟,模仿人类大脑对图像特征进行提取。深度学习模型结构复杂多样,包括深度卷积神经网络、深度信念网络等,其中深度卷积神经网络在图像分类中的应用最为广泛。从图像语义复杂程度来说,图像可以划分为单标记图像和多标记图像,单标记图像是一幅图像仅属于一个类别,多标记图像因为图像语义内容丰富,可将图像同时分到不同类别中。本文分别从解决单标记图像和多标记图像分类的角度来探讨深度学习在图像分类中的应用,提出的方法介绍如下:1.基于底层特征改进的深度图像特征提取方法。深度图像特征是对图像高层语义的描述,底层特征是对图像色彩和像素分布规律的描述,将两种特征进行融合,提出了基于底层特征改进的深度图像特征提取方法。首先使用深度模型提取图像特征,然后提取颜色直方图特征,最后通过组合的方法生成新的特征,在单标记图像集CIFAR-10和ImageNet上同时使用Softmax和SVM分类器进行分类。实验结果表明,新的特征表示方法提高了图像分类的精度。该方法将图像底层特征与高层语义特征进行组合,提高了图像的特征表征能力。2.基于降维方法改进的深度图像特征提取方法。使用深度学习技术对图像提取特征后,特征维度依然很高,为了降低特征维度,减少计算的复杂度,本文通过传统降维方法对深度图像特征提取进行改进。首先使用深度模型提取图像特征,再分别使用不同的降维方法PCA和LDA对深度图像特征降维处理,生成新的特征,在单标记图像集ImageNet上同时使用SVM和KNN分类器进行分类。实验结果表明,有监督的降维方法显著提高了图像分类的性能。3.基于深度学习改进的多标记图像分类。图像一般具有多个标记,分属不同的类别,多示例多标记学习框架的提出解决了图像多分类中存在的难题,本文对多示例多标记KNN算法对多标记图像分类进行改进,包括包的生成方法、特征提取方法和距离度量方法。首先对图像均匀分割,每幅图像被均匀分割成四部分,然后对图像区域提取特征,分别提取颜色、纹理特征和深度图像特征,提出两种不同的包的生成方法,最后使用多示例多标记KNN算法对图像分类,在算法中使用最小Hausdorff和平均Hausdorff距离两种不同的距离度量方法进行对比。在场景分类图像集上的实验结果表明,深度图像特征优于传统的颜色纹理特征,明显提高了图像的分类准确率。