论文部分内容阅读
得益于人工智能的飞速发展,图像识别技术已经渗透到人们生活的方方面面,如何准确、高效的对各类图像进行识别成为了计算机视觉领域的热点。深度学习算法通过模拟人脑,集特征提取与分类识别于一体,在计算机视觉领域一直有着出色表现。胶囊网络是一种新兴的深度学习方法,它使用两层向量间的动态路由机制算法代替了传统卷积神经网络的池化层,不仅避免了信息的丢失,而且也能够很好的表征待识别对象的空间结构关系,有效弥补了传统卷积神经网络的不足之处,但是针对具体的分类识别任务,如何做出改进发挥其优异性能有待探究。结合胶囊网络的自身优势,本文对重叠遮挡的字符以及存在旋转变化的图像进行了识别研究,具体工作如下:1、改进胶囊网络的有序重叠手写数字识别方法。原有的胶囊网络识别重叠手写数字时没考虑输出字符的顺序,为此对胶囊网络结构做出改进,设计了含有多个数字胶囊层的识别模型,实现了有序重叠手写数字识别。实验结果表明,该方法的识别准确率达到87.62%,大大高于卷积神经网络识别,证明了该方法的有效性,同时也为字符重叠验证码识别提供了一定的参考价值。2、基于胶囊网络的字符重叠验证码识别。为了极大程度的减少训练成本并实现胶囊网络对多个字符的有序识别,将图像中所有的字符转换成了向量的形式,构建了验证码识别模型,使其将图像中的多个字符看作是一个分类任务进行识别,最后在数据集上进行了实验,证明了该方法的可行性。3、基于局部二值模式和胶囊网络的遥感地物图像分类。为提高遥感地物图像的分类准确率,本文首先将圆形LBP特征图像与RGB图像进行了通道融合,其次引入了1*1的卷积层,用以更好的实现信息整合并提升网络的表达能力,除此之外还设计了更深的胶囊网络结构,使其能够提取到更高层次的遥感地物图像信息。在数据集上进行测试并与其它方法进行了对比,实验结果表明本文方法不但具有不错的收敛性,而且还能显著提高遥感地物图像的分类准确率,尤其是针对纹理信息较为丰富的图像,识别率均有4%以上的提高。