论文部分内容阅读
高分辨率光学遥感图像的特征提取是遥感领域的研究热点,是实现目标检测、场景分类等计算机视觉应用的基础。随着计算机视觉和模式识别等学科领域的发展,高分辨率光学遥感图像的特征提取研究已经取得了长足的进步。然而,高分辨率遥感图像中存在复杂多变的地物目标外貌、剧烈的光照变化、地物目标的多方向旋转、部分遮挡和有限的标注数据等问题,提取有判别力的特征仍然是一个难题。 本文针对高分辨率光学遥感图像的目标检测和场景分类问题,将先验知识与特征编码、深度学习等新方法有机结合,研究高分辨率光学遥感图像的特征提取方法。论文的主要贡献如下: 1.提出一种新的基于序金字塔的特征汇聚方法,对高分辨率遥感图像中的目标进行旋转不变特征描述。该方法将图像区域内的像素点按照其径向梯度方向(或者径向梯度角)的大小进行排序,并采用金字塔式的划分策略将排序后的像素点由粗到细地均匀划分为若干个群组,分别计算、汇聚各群组内像素点的局部特征。这种划分方式可以在保持旋转不变性的同时编码径向梯度方向(或者径向梯度角)的分布信息,并提高对像素点径向梯度方向(或径向梯度角)顺序漂移的鲁棒性。最终的特征描述由各群组的汇聚特征串联获得。为了保持该方法的旋转不变性,使用理论上旋转不变的Fourier HOG特征作为像素点的局部特征,并使用Fisher Vector编码技术进一步提升其判别能力。论文在高分辨率遥感图像的飞机检测和车辆检测实验中论证了该方法的有效性。 2.提出一种新的旋转不变矩阵视觉特征描述方法,可以在包含径向空间信息的同时编码角度空间信息,并能保持提取特征的旋转不变性。基于旋转不变矩阵特征,进一步提出了一种更具有判别能力的旋转不变特征提取方法。具体地,首先使用旋转不变矩阵特征描述图像内稠密的、相互重叠的子区域;然后使用Fisher Vector对所提特征进一步编码;最后,为了在保持旋转不变性的同时编码更丰富的空间信息,使用环金字塔的划分策略将Fisher Vectors由粗到细地划分为多个群组,并分别对其进行特征汇聚。这些精心设计的步骤,使得该方法在高分辨率遥感图像的飞机检测和车辆检测中表现出良好的性能。 3.提出一种基于卷积神经网络的混合分辨率编码特征提取方法。该方法使用局部聚合描述符分别编码卷积神经网络的底层和中层的卷积特征,并使用主成分分析对这些编码特征降维,生成层次化的全局特征;同时,该方法对卷积神经网络中各全连接特征分别进行平均池化和归一化处理,并在其基础上生成新的全局特征。混合分辨率编码特征是上述所有全局特征的串联,它可以同时包含卷积神经网络的底层、中层和高层特征。由于局部聚合描述符和平均池化策略的使用,所提方法可以处理不同尺寸的图像。在两个国际公开的UC-Merced数据集和Brazilian Coffee Scenes数据集上的场景分类实验论证了所提方法的有效性。