基于局部特征的图像匹配关键技术研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:sjn19900523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几十年来,随着数字图像获取技术的迅速发展,数字图像的数量和种类也以前所未有的速度增长着。海量的图像数据带来了图像处理和图像分析方面的迫切需求,其中如何高效地进行数字图像的管理成为研究的难点和热点。例如,用户通过指定一张某建筑物的图像,希望在收集的数码照片中找到所有含有该建筑物的图像;或者给出一个物体的图像,检测含有该物体的所有图像。   为了满足以上的应用需求,图像管理面临的一个基础而又重要的问题就是图像匹配问题,即给出两幅对应同一场景或含有同一物体的图像,如何确定正确可靠的图像间对应关系。由于在一般情况下,同一场景的图像间可能存在旋转、尺度变化、局部遮挡等多种情况;而进行物体检测时,物体在待匹配图像中往往只占一小部分,通常也存在背景混杂、局部遮挡、光线变化等多种不利于匹配的因素。这些都使图像匹配成为一个复杂而困难的问题。   本论文着重研究了基于局部特征的图像匹配中的若干关键技术,围绕局部特征的检测和描述,特征的匹配以及错误匹配排除三个重要问题进行深入的研究。本论文的主要贡献如下:   1.提出了一种新的局部特征检测和描述算法:多尺度定向角相关(Multiscale OrientedComer Correlation,MOCC),以及与其相适应的多层匹配策略。该算法利用高效尺度空间构造方法与快速角点检测算法进行多尺度的局部特征检测,利用特征区域内灰度值及其均值和方差生成旋转不变的特征描述。与主流的尺度不变的特征提取算法相比,MOCC算法的特征提取速度提高了近10倍,且在较大尺度变化时的匹配性能优于主流算法。利用多层匹配策略能够显著提高匹配过程的速度,其与MOCC算法相结合得到的匹配方法,对图像匹配所需的全部时间和现有的最快算法相比有明显的速度提升。利用所提出的MOCC算法和多层匹配策略,实现了基于归一化互相关的显著尺度变化下的高效图像匹配,克服了传统的基于相关的匹配技术的局限性。MOCC算法和基于多层匹配策略的匹配过程可在不同尺度上并行操作,这为采取并行处理加速硬件的实现创造了很好的基础,其性能还有进一步提升的潜力。   2.提出了一种旋转不变的基于奇异值分解的图像匹配算法,利用该算法不仅能实现基于归一化互相关的旋转不变的图像匹配,而且无需在匹配过程中设置匹配阈值,克服了传统匹配算法需要根据不同情况调整匹配阈值的不足。所提出的算法具有良好的扩展性,可方便地与利用其他类型局部特征描述子的匹配技术进行融合并获得性能上的提升。将其应用于主流特征检测和描述技术的实验结果显示匹配性能有一定程度的提高。   3.提出了一种新的错误匹配排除算法WIB-RANSAC算法。错误匹配的排除是图像匹配技术的重要组成部分,特别是在图像问存在较大变化时,初始匹配中的错误匹配比例往往较高,有效的错误匹配排除算法能够进一步提高匹配结果的正确性与可靠性。本文提出的WIB-RANSAC算法,其核心思想是将主方向一致性约束与外极线约束相结合,通过利用主方向一致性检验与惩罚性打分技术,克服单纯的基于外极线约束的错误匹配排除算法的不足。实验结果表明,所提出的算法能够有效排除基于RANSAC的传统算法所无法排除的错误匹配,同时具有较高的运行速度且无需图像的先验知识。该算法可应用于在局部特征检测和描述阶段进行了主方向计算的各种匹配技术。   此外,本论文提供了一个系统的和较为全面的局部特征检测技术综述,参考其他对局部特征检测方法的分类框架提出了对局部特征检测技术的新的分类体系;总结了30多年来局部特征检测的主流方法和技术,并进行了分析和评价。这篇综述对相关研究人员进行后续的研究,能够起到一定的参考作用。   基于所提的部分技术,本文设计并实现了图像匹配系统ZMatching和图像检测系统ZSearching。图像匹配系统ZMatching用于对用户输入的两幅图像进行匹配并给出详细的匹配结果;图像检测系统ZSearching可以根据用户指定的图像,在硬盘上的给定位置对所有图像进行检测,找到包含用户感兴趣内容的图像。用户指定的图像既可以是场景图像,也可以是含有特定建筑物或各种物体的图像。ZSearching图像检测系统具有检测速度快,能处理各种常见的图像变化,无需对数据库进行预处理的特点。ZMatching和ZSearching可以帮助用户自动高效的进行数字图像的管理。   总之,本文的研究工作在深入分析现有基于局部特征图像匹配技术的不足的基础上进行,通过研究局部特征的检测与描述、特征的匹配以及误匹配排除几个主要方面的问题,提出了一系列旨在提高基于局部特征图像匹配技术的性能和健壮性的技术,从而为数字图像管理的各类应用提供了良好的基础,具有广泛的应用前景。
其他文献
文本检索通常分为两个阶段,初始检索和重排序。初始检索目标是以较低的代价从整个文档集合中检索出一小部分文档,使其包含尽可能多地相关文档,即具有较高的召回率。初始检索过程
随着互联网上资源的不断丰富,越来越多的人们通过网络进行资源的搜索,共享,浏览和下载。在P2P对等系统中,用户的这些行为和需求体现得更加明显。在传统的方法中,人们通过关键词搜
在煤炭这个行业中,特别是在我国,瓦斯灾害一直困扰着我们。开采煤矿的整个过程中,特别是随着煤炭开采深度的增加,在安全这个方面上出现的问题是越来越多,因为瓦斯爆炸而出的
传统的机器人遥操作模式大多数是基于视频反馈技术,操作者采用“运动-等待”的方式,一方面由于有限的网络带宽不能准时正确地传输远程的数据图像而导致误操作,另一方面网络时
索引技术是现代信息检索、搜索引擎和数据挖掘的关键技术之一。对于大规模文本检索系统,倒排索引是目前为止最高效的数据索引方法。倒排索引包含了词(Term)对应文档的关系信息
在数字信息时代,人们对信息的需求表现得前所未有的强烈,尤其是在互联网浪潮席卷全球之后,这种需求达到了极至。庞大互联网的出现,给我们提供了无穷的学习资源。伴随搜索引擎
在教育领域,人们一直在尝试着将计算机及互联网技术应用于教学活动中,提高计算机教学辅助化工作的水平。在一般的课程管理系统(Course Management System, CMS)之外,面对计算
近几年网络流识别吸引了越来越多人的兴趣,准确快速的识别网络流应用层协议数据所属协议类别,将对当前网络的运行和管理带来重大现实意义,有助于深化网络流工程学,网络容量设计和
随着计算机技术的发展,系统仿真作为一种先进的计算机技术,已经被广泛应用于国民经济和国防建设的各个领域。同时,为了适应现代战争要求和科学技术的进步,外弹道学在近几十年
基于可视性的最优路径分析是地形可视性分析中的一项基本功能,属于空间决策支持的范畴,在理论研究和实际应用两方面都具有重要的意义。在传统基于可视性的最优路径分析中,影响通