基于目标关联统计信息的图像语义分割

来源 :厦门大学 | 被引量 : 0次 | 上传用户:fxyygs99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分割是指将图像分解为多个各具特性的区域(也称为超像素)的过程。图像分割的目的是为了更直观地表达图像各个区域所包含的不同信息以及区域间的联系,图像分割结果的好坏直接影响到后续分析、理解和识别的准确性。传统的图像分割基本都是基于特定目标或区域的方法,与图像的其它区域失去联系,这种分割效果忽略了区域及区域之间的语义信息。本文的工作在于寻找一个能够挖掘目标及目标之间关联信息的模型,有效地指导分割过程。   基于条件随机场(Conditional Random Fields,CRF)的图像分割技术是近年来计算机视觉领域的研究热点。该方法的核心思想在于构造一个具有观察数据的概率图模型(Probabilistic Graph Model,PGM),给出一个对应该图的吉布斯(Gibbs)能量函数,通过各种最大后验概率(Maximum a Posteriori,MAP)准则来最小化该能量函数,该模型的新颖之处在于它的全局最优和分割结果的语义性。本文的主要工作如下:   (1)首先介绍了传统图像分割技术,包括CRF的理论原理及其在图像分割领域的应用现状。然后采用纹理基元(Texton)、LBP(Local Binary Pattern)、SIFT(Scale Invariant Feature Transform)和彩色SIFT(Color SIFT)多种图像特征向量作为图像区域底层视觉信息,利用K-means对这些底层信息聚类,将聚类结果用来表示吉布斯能量函数单点势(unary potential)和点对势(pairwise potential),采用AdaBoost分类器对单点势和点对势训练来构造CRF。   (2)分析传统的CRF模型在图像分割领域的优点和不足,采用一个能够集成多种CRF优点的分层式新型CRF模型,该模型既有传统CRF的优点,也能在不同CRF层之间通过辅助变量来增强重叠分割区域的权值,使得分割边缘更加精确,目标的语义更显著,同时也能将推理归纳得到快速的图割(Graph-cut)方法。   (3)针对图像分割中出现的同个目标包含多个子目标的情况,引进共生统计因子来抑制不合理的目标共存,以改善分割结果。
其他文献
目标检测是视觉感知的一个重要任务,其目的是将视觉目标从背景中分离出来,或者分析不同目标之间的空间关系。在该问题中有四个关键因素影响着目标检测的性能:一是搜索方式;二
目前皮革缺陷的检测主要靠工人目测,检测结果受主观因素影响大。随着成像技术、计算机技术、计算机视觉理论及大规模集成硬件的不断发展,使利用这些技术对皮革缺陷进行自动检
遮挡现象在人类的日常生活中随处可见,当视觉目标沿着观测者的观测方向在空间结构上产生交错,必定会导致对观测者观测行为的干扰,比如在模式识别、自动化场景认知、三维重建
网格计算是近年来研究较为热门的一项技术,它能够把整个互联网集成为一台巨大的超级计算机,实现全球范围的计算资源、存储资源、数据资源、信息资源及知识资源等广泛分布的大量
社区结构作为社会网络的一个非常重要性质,可以反映出社会网络成员个体的行为特征以及与其它个体的关系特征,发现社区结构有助于对社会网络内部规律的分析与理解,对社会网络
以神经元为基本信息处理单元的生物神经网络系统,被广泛地用来描述认知、决策和控制等智能行为方面的问题。人们在神经网络的动力系统方面进行了研究:经典的单层单向的Hopfield
在高速网络环境下,并行文件系统以其高可靠性、高扩展性、高并发性在科学与商业领域得到了较为广泛的应用。Lustre作为典型的并行文件系统采用了基于对象的存储技术,将存储对象
随着软件系统的复杂程度增加,需要在软件开发的各个阶段保证软件质量。基于UML模型测试的最大优越性在于,测试过程能和程序实现实现同步,因而成为软件测试的研究热点之一。面对
人脸识别作为生物特征识别的主流技术之一,是国内外研究和应用的热点。主流的人脸识别技术对光照、姿态等由于非理想采集条件或者用户不配合造成的变化鲁棒性较差。流形学习
近年来,网络安全问题不断凸显,病毒(Virus)的数量呈指数级增长,其危险性也在不断增加。各个互联网安全厂商分别设计开发新的安全防护产品,以加强对病毒入侵的检测工作。在这些新