论文部分内容阅读
图像分割是指将图像分解为多个各具特性的区域(也称为超像素)的过程。图像分割的目的是为了更直观地表达图像各个区域所包含的不同信息以及区域间的联系,图像分割结果的好坏直接影响到后续分析、理解和识别的准确性。传统的图像分割基本都是基于特定目标或区域的方法,与图像的其它区域失去联系,这种分割效果忽略了区域及区域之间的语义信息。本文的工作在于寻找一个能够挖掘目标及目标之间关联信息的模型,有效地指导分割过程。
基于条件随机场(Conditional Random Fields,CRF)的图像分割技术是近年来计算机视觉领域的研究热点。该方法的核心思想在于构造一个具有观察数据的概率图模型(Probabilistic Graph Model,PGM),给出一个对应该图的吉布斯(Gibbs)能量函数,通过各种最大后验概率(Maximum a Posteriori,MAP)准则来最小化该能量函数,该模型的新颖之处在于它的全局最优和分割结果的语义性。本文的主要工作如下:
(1)首先介绍了传统图像分割技术,包括CRF的理论原理及其在图像分割领域的应用现状。然后采用纹理基元(Texton)、LBP(Local Binary Pattern)、SIFT(Scale Invariant Feature Transform)和彩色SIFT(Color SIFT)多种图像特征向量作为图像区域底层视觉信息,利用K-means对这些底层信息聚类,将聚类结果用来表示吉布斯能量函数单点势(unary potential)和点对势(pairwise potential),采用AdaBoost分类器对单点势和点对势训练来构造CRF。
(2)分析传统的CRF模型在图像分割领域的优点和不足,采用一个能够集成多种CRF优点的分层式新型CRF模型,该模型既有传统CRF的优点,也能在不同CRF层之间通过辅助变量来增强重叠分割区域的权值,使得分割边缘更加精确,目标的语义更显著,同时也能将推理归纳得到快速的图割(Graph-cut)方法。
(3)针对图像分割中出现的同个目标包含多个子目标的情况,引进共生统计因子来抑制不合理的目标共存,以改善分割结果。