论文部分内容阅读
识别和定位是计算机视觉的两项重要任务,识别是在图像中找到期望物体的过程;定位是确定物体位置与姿态的过程。识别与定位的依据是物体的特征,包括颜色、纹理、结构、形状等,其中形状是常用的特征之一。形状匹配是实现物体识别和定位的重要方法,它作为计算机研究领域的热点问题之一,已有很长的研究历史,取得了很多重要的研究成果,并且已有部分成果取得了应用。尽管如此,由于形状匹配的复杂性,还存在尚未完全解决的理论问题,它目前仍然是计算机视觉领域的一个研究重点。本文对基于轮廓的形状匹配方法开展研究,具有重要的理论意义与实际应用价值。 形状匹配要考虑的因素很多,如物体是否为刚性物体、匹配的变换群、轮廓点集是否有序等。以实际的工程应用需求为背景,本文利用形状的轮廓信息,在不同条件下对匹配方法开展了研究: (1)欧氏变换下基于启发式混合遗传的形状匹配方法 基于轮廓点梯度信息的形状匹配方法适用于各种形状的物体,但是需要全局遍历。由于梯度方向和物体的结构有关系,对于特定形状的物体,就可以结合合适的优化算法加快搜索速度,以避免耗时的全局遍历。图像的宽边缘特性使得利用梯度信息的匹配方法在最优解附近是局部上升的,因此可以通过爬山法等局部优化算法快速找到最优解。所以,对于杂乱场景下的直线型物体,研究如何利用这些特点设计避免遍历以加快搜索速度的方法。 (2)相似变换下基于点对上下文直方图特征的形状匹配方法 由于轮廓段在遮挡和混乱的情况下是断开的,而之前的匹配方法通常要求模型轮廓段和检测图像中轮廓段对应或者用局部的容易受噪声影响的特征进行匹配,所以设计一种可以表达部分轮廓段的描述子是必要的。又柔性的物体通常是由独立的部分构成的,例如人体的头部、躯干和四肢,这些独立的部分构成一个类似于弹簧的模型。每个独立的部分是带形变的具有独立旋转平移缩放等变换的模型。利用这些独立部分的相互约束关系,可以构造一个轮廓段整合方案。针对上述问题,研究能够表达轮廓段特征的描述子,轮廓段整合方法,和基于两者的形状匹配方法。 (3)仿射变换下基于多尺度积分特征的形状匹配方法 在有序点集闭合的情况下,形状可以表示为轮廓点构成的曲线,也可以表示为内部的区域。将多尺度积分不变量应用到仿射变换下,需要已知形状之间的仿射变换关系。由于利用特征点是计算仿射变换最直接的方法,而现有的方法存在着提取的特征点个数少或提取方法复杂的问题。针对上述问题,研究仿射变换下基于多尺度积分特征的形状匹配方法,包括“基于凸包的特征点提取方法”,“基于各向异性高斯核的多尺度积分特征”和基于这两者的匹配方法。同时研究如何将形状之间的仿射变换降级为正交变换,然后直接利用多尺度积分特征进行匹配的方法。 (4)射影变换下基于分层射影不变特征的形状匹配方法 由于共面二次曲线对存在着射影不变量,对轮廓上的点拟合二次曲线可以避免其它方法中特征点不稳定的问题,所以射影变换下的形状匹配可以利用共面二次曲线对的方法;对此,研究如何利用共面二次曲线对构成能够描述形状局部到全局信息的丰富特征。 本文针对不同条件下的形状匹配方法进行了研究,根据不同的应用需求,对速度和识别率分别进行了提升,丰富和补充了现有的形状匹配方法,具有一定的应用价值。