论文部分内容阅读
近年来,随着计算机视觉技术的发展。提取图像特征并进行分析和处理的需求也日益增多。图像特征是图像分类、识别等高级计算机视觉任务的基础,合理的图像特征处理方法能够有效地提高图像特征的表达能力,从而可以更为准确的提取图像特征信息,因此对图像特征处理方法的研究是必要的。尺度不变特征转换(Scale Invariant Feature Transform,以下简称SIFT)是一种通过手工提取的具有泛用性的图像特征,SIFT能够保持旋转、缩放、亮度变化等操作的不变性,在图像的匹配和识别中有着广泛的应用。神经网络则是目前用于模式识别的一种典型的算法,在多分类问题中能够有良好的表现。本文的主要研究内容是结合神经网络对图像的SIFT特征进行处理,并将这种处理方式应用于杆塔零件的识别中。本文的主要工作有:1.不同图像中所能提取的SIFT特征的数目不同,这会给后续的处理带来许多困难。针对这个问题,本文中研究了处理这种缺陷常用的编码方式,并根据原有局部聚合向量(vector of locally aggregated descriptors,以下简称VLAD)编码方式中会损失一部分局部信息的问题,提出了一种基于VLAD改进的编码方式。而对于传统的SIFT特征中并没有包含图像颜色特征的缺陷,构建了用于融合处理颜色特征和编码后的SIFT特征的BP神经网络,此网络在杆塔零件的识别中的效果比起其他的算法有着较好的效果。2.当前SIFT特征的研究和应用中,大多数时候只使用了SIFT特征的描述子,而对于SIFT特征点的相互关系却并没有很好的使用和研究。基于此问题,本文提出了结合SIFT特征点的在图上的相互关系信息和SIFT特征描述子生成图结构的算法。并基于图顶点域特征提取的方式了设计了用于处理这样的图结构的卷积神经网络。在杆塔零件的识别中,可以看出在加入SIFT特征点在空间中的相互关系信息之后,较之前的方式有了识别效果的提升。3.基于本文的算法设计并实现了一个基于神经网络的图像SIFT特征分析系统,完成了相关的编码和测试工作,并详细的展示了系统的运行结果。