图像特征的相似性度量

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:masdfsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相似性度量是模式识别的基本问题,很多算法的性能都极大地依赖于相似性度量的好坏。例如排序、最近邻分类、聚类和各种基于图的半监督学习算法均以样本间的距离度量为基础。另外,核学习方法的基础——核函数也是一种特殊的相似性度量。在与模式识别紧密联系的计算机视觉中,相似性度量也一直是重要的研究方向。与前者相比,计算机视觉要求相似性度量集成相关的领域知识,并希望其符合人类的感知。如何设计满足上述要求的相似性度量是计算机视觉中的重要问题。   本文以上述要求为准则,研究了一般视觉特征向量和直方图的相似性度量,提出了新的距离度量和核函数,并提出了同时利用多种类型特征上相似度的学习算法。本文取得的主要成果包括如下四点。   1.证明了核主成分分析可以分为两个独立的步骤,并提出了一种非线性降维算法——多相似度主成分分析。核主成分分析可以分为核特征向量的提取和在核特征向量上的主成分分析两步。一个样本的核特征向量由这个样本和所有训练样本的核函数值组成。多相似度主成分分析使用多个核函数分别计算样本在不同类型特征上的相似度,从而将核特征向量扩展为核特征矩阵,并使用已有的二维主成分分析对核特征矩阵降维。由于该算法分别利用了不同类型特征上的相似度信息,因此其性能优于经典的子空间方法。   2.提出了动态相似度核函数。认知心理学中的相似度理论表明,人类根据两个物体最相似的部分推断两者整体上的相似性。依据该理论,该方法动态地选择特征向量中距离最小的部分维度进行比较,并以此计算核函数。该核函数能显著提高图像分类和人脸识别,特别是有遮挡情况下人脸识别的性能。   3.提出了动态部分泥土搬运距离。依据同样的心理学理论,该方法动态地选择泥土搬运距离中搬运距离最小的部分泥土,并以此计算直方图之间的距离。相对泥土搬运距离,该方法更好地模拟了人类的感知。   4.提出了保持拓扑的扩散距离。多数距离将直方图简单地看作多维区间甚至一维向量,因此破坏了直方图分量(bin)的近邻关系,影响了距离的性能。该方法通过测量定义在直方图定义域上的热扩散过程来计算直方图距离,考虑了直方图的拓扑结构,更加符合人类的感知。
其他文献
疲劳驾驶是交通事故的一个重要原因,对财产和生命造成巨大的损失,驾驶员疲劳检测对提高交通安全具有非常重要的意义。本文根据疲劳的特征研究结果,在不影响司机驾驶的情况下检测
智力的生物学基础是长久以来科学家们一直关心的问题。虽然以往的研究已经指出智力可能与多个脑区相关,但是目前还没有研究从基于脑成像的全脑网络角度对智力与脑的关系进行考
学位
二十世纪九十年代以来,随着运动捕捉技术的发展,大量的三维人体运动捕捉数据库被建立起来并广泛应用于手势识别的研究当中。正确高效的分析处理这些三维人体运动数据,对大规模三
随着信息技术和计算机网络技术的发展,人类的生活和工作空间得到了极大的扩展。人们每天不仅进行面对面的交流,同时也会和各种身份的人进行远程沟通。在此背景下,身份的识别变得
学位
本文提出了一个城市公路交通网络的分层模型。模型认为,车流有自由流动和拥挤流动两种状态。两种状态下的车流密度、流率等车流信息均以波的形式传播,波速大小几乎恒定但方向不
运动控制是自动化研究领域的一个重要分支,是推动新产业革命的关键技术之一。运动是机械学科的重要概念,而控制则是控制学科的研究对象和研究内容,因而运动控制具有跨学科的性质
变电站规划是城市电网规划的重要内容,本文针对现有算法的缺点和不足,提出了基于加权Voronoi图的变电站规划算法,并在此基础上做了进一步的完善和改进,主要包含以下几个方面:1、本文采用了加权Voronoi图的变电站规划算法,并加入了选址过程中已有站容量的变化,增加考虑了对孤立负荷点及孤立站以及规避不可建站区域的处理方案,大大缩短了程序的运行时间,而且算法能保持很好的收敛性。2、本文提出了基于运输模
防灾、减灾和救灾事关人民生命和财产安全,是国家公共安全的重要组成部分。在危险和恶劣的灾后环境中,救援机器人是一种可以协助救援人员进行相关搜索探测和救援工作的重要辅助
LXI总线是一款相对新型的仪器总线,其结构开放,且不需要专用机箱,为组建分布式自动测试系统提供了十分便利的条件。同时LXI总线与其它仪器总线组建的混合测试系统也为测试复杂的被测对象提供了一种方便、灵活的解决方案。示波器是一种综合的信号特性测试仪,可以形象地显示信号随时间变化的波形,是电子测量仪器中的基本仪器,也是应用最广泛的电子测量仪器。本文首先介绍了仪器总线的研究背景以及国内外示波器的发展现状,
How to retrieve the vast audio information effectively and efficiently is not only a hotspot for researchers, but also a trend for the industrial community to b
学位