论文部分内容阅读
数字图像中的特定目标检测问题一直是计算机视觉以及模式识别领域广泛关注的主要研究课题之一。该类问题的研究已经在某些方面取得了一定进展,如人脸检测等已经在实际中得以应用,行人检测也取得了不错的效果。然而,在当前的目标检测研究中还存在较多问题没有解决,如检测目标的旋转不变性问题。在一般的目标检测应用中,旋转问题所造成的负面影响并不严重。然而,对于卫星图像、航拍图像,由于拍摄角度的问题,平面内的旋转问题是普遍存在的。因此,要解决此类图像中的目标检测问题,平面内旋转不变性是个不可回避的问题。本文以谷歌地球中的图像为例,以机器学习和目标检测领域为理论基础,提出新的思路和算法,针对卫星图像和航拍图像中旋转不变的飞机检测问题,达到了预期的检测精度。据所知,目前关于旋转不变的飞机检测的论文仅有一篇,且它并不是专门针对飞机检测问题,而它的检测效果也并不理想。本论文是第一篇关于旋转不变飞机检测专门方法的研究。
本文的贡献主要包括以下几个方面:
1.提出一种新的对目标旋转角度进行回归的方法。在此方法中,把回归的自变量值设为方向梯度直方图(HOG)特征值,把因变量值设为二维,对神经网络、高斯过程、支撑向量三种回归方法分别进行了实验,其中,支撑向量回归的角度平均绝对误差值在70以下。
2.基于飞机的旋转角度,验证了方向梯度直方图特征对飞机目标的检测能力,并对分类器进行了进一步的探索,提出自己的方法。所提方法融合了整体HOG特征、SVM分类器和级联方法的优势,在飞机检测问题上实现了15%的等错误率(EER)。
3.基于谷歌地球采集了406副图像,裁剪出其中200副图像的1251架飞机,并对飞机的旋转角度进行了标注,为以后的工作提供了重要的研究数据。
本文所提方法虽然是针对于卫星图像、航拍图像的平面内旋转不变的检测问题,但其理论和算法也可以应用到普通数字图像的基于内容的检索和识别等问题。其中旋转角度回归的方法,对于结构明显的刚性物体都可以适用。