论文部分内容阅读
作为当前计算机视觉领域及遥感图像应用领域的研究热点和难点,图像理解问题的主要任务包括解释所感知的图像场景以及场景中包含的目标。由于图像分辨率日渐提高,其包含的信息量更为丰富,不仅突出了感兴趣目标的细节信息,同时也增强了背景干扰,使现有的图像理解方法面临了新的挑战,其中典型的问题主要包括复杂场景中结构复杂目标的检测与识别以及复杂图像场景的分类与标注等。
本文以随机几何理论、统计学习理论等为基础,着重对图像理解过程中的高层建模方法以及视觉特征融合方式进行研究。同时,本文的研究将以上两方面内容置于统一处理框架下,组合并构建新的方法,力求针对以上问题,提出稳定性高、通用性强的处理方法。
本文的主要创新点为:
1.在随机几何理论的基础上,提出了一种基于随机目标过程模型的目标检测方法,用于检测复杂场景下结构相对复杂但几何部件特性相对单一的目标。
针对标值点过程模型难以准确表征结构相对复杂目标的形状而影响处理结果准确性的问题,提出了改进的基于随机目标过程模型的目标检测方法。该方法选择物体的几何部件作为处理单元,能降低对训练样本数量的需求。同时,在模型中引入与目标结构特性相关的先验知识,指导目标及其组件的组合式建模,克服了目标部分信息缺失对检测结果的影响。另外,结合随机目标过程模型的特点,该方法以概率的方式加权组合边缘、区域特征的响应值,充分发挥了各类特征的优势。实验结果表明该方法对训练样本的需求量较小,具有较高的检测性能。
2.根据统计学习理论,提出了一种基于分层次模型的目标识别方法,用于对复杂场景中结构复杂目标进行识别。
针对现有方法对结构复杂目标的形状特征难以准确描述的问题,按照统计学习理论的思想,提出了基于分层次模型的目标识别方法。该方法全局组合目标各片段区域,以稀疏表达方式实现对目标形状特征的描述,克服了物体类间差异对方法的影响。同时,利用条件随机场模型融合多类特征,既能够考虑图像各区域之间的相互关系,增强了处理结果的完整性,又可以克服图像发生变化等干扰,提高了方法的处理精度。实验结果表明该方法具有较高的稳定性和普适性。
3.参照主题模型的思想,提出了一种基于空间一致主题模型的图像分类与标注方法,用于实现对复杂场景图像的分类与标注。
针对传统LDA模型在图像分类的过程中,通常忽略图像片段或目标部分之间的空间关系以及图像全局信息与局部信息之间的联系等问题,提出了基于空间一致主题模型的图像分类与标注方法。该方法将图像类别信息和标注内容分别视为对图像的全局和局部描述,两类信息相互辅助,提高了处理结果的可信度。同时,考虑到目标的空间一致性,将外观相似的邻域赋予相同的隐含主题,既提高了处理结果的完整性,又克服了目标形变的影响。另外,该方法通过采用过分割处理,将图像区域的多类信息形成统一的特征词汇,降低了特征的维度,提高了方法的效率。实验结果表明该分类与标注方法具有较高的准确率和计算效率。