自然图像的语义信息提取研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:szywit01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体数据库的不断发展,传统的图像检索方法已经再也无法满足图像检索的需要,基于语义的图像检索已经成为当前的研究热点。为了实现基于语义的图像检索,许多研究者将图像的底层视觉特征融合为图像特征向量,用支持向量机(Support Vector Machine,SVM)实现图像底层特征和高层语义的关联,这种关联的方法是借助于图像语义分类方法实现的。图像语义分类一直是计算机视觉领域研究较多的一个问题,它的主要目标是根据图像含有的内容把图像分为多个不同的类别,一幅图像可以含有很多物体,比如山,河流,天空,草地等,如何识别这幅图像含有的物体是图像语义分类的关键,也是提取图像语义信息的主要工作,这是计算机视觉的一大难点。在自然图像语义信息提取中,特征提取和分类算法是影响语义信息提取结果的两个主要方面。为改善自然图像分类效果,更准确和完整地提取语义信息,本文研究了训练集的优化方法、颜色信息与纹理信息的融合方法和提取图像语义内容的方法。   对自然图像分类时,使用结合颜色、纹理和边缘信息的组合特征可以提高SVM分类器的分类精度,但训练集的优劣才是影响分类精度的关键因素,本文使用密切关系传播算法(Affinity Propagation,AP)对SVM训练集进行优化。首先将训练集的图像均匀分割成若干图像块,然后计算每块的组合特征直方图,接着使用AP算法进行聚类,聚类之后的训练集是每类图像的代表块,这样不仅增大了训练集,而且得到的代表图像块消除了图像中的冗余信息,保留了图像的主要内容,从而优化了训练集。最后使用一对多SVM分类方法对测试图像分类,实验结果表明分类精度得到大幅度的提高,而且提取的语义信息更完善和准确。   对自然图像分类时,纹理分析有助于提高图像的分类精度。目前,在对自然图像纹理分类时,其他研究者直观地选择了最优的颜色空间进行分类,他们没有考虑到颜色空间对分类精度的影响。为此,本文提出衡量样本类的紧密性或者说是可分性的核散布矩阵测度,一个样本类的紧密性和可分性是相对的,紧密性越好,可分性越差,并利用此测度提出一种颜色空间选择模型:在十二个颜色空间中分别计算每类样本的核散布矩阵测度,并根据测度的大小选择对每类图像提取纹理特征应使用的颜色空间。这种方法可以为每幅图像纹理分类选择最适当的颜色空间。实验采用一对一SVM分类器测试这个模型的有效性,得到的分类效果明显优于其他任何一个颜色空间的分类效果。因此,将自然图像的颜色信息和纹理信息进行有效的融合可以提高分类精度,从而改善图像的语义信息提取效果。   本文的创新之处在于:   1.使用AP无监督学习算法实现SVM训练集的优化,使优化后的训练集在高维空间的分类超平面产生更大的分类间隔,从而改善了自然图像的分类效果和语义信息提取效果。   2.提出核散布矩阵测度和基于这种测度的颜色空间选择模型,并应用此选择模型实现自然图像纹理分类时颜色空间的自适应选择。这种方法有效地融合了颜色和纹理信息,大大提高了自然图像的分类精度。
其他文献
计算机立体显示技术能使二维平面设备展现具有深度层次的立体视觉效果,它是虚拟现实的关键技术之一,也是一个基本的虚拟现实系统必须具备的条件。本文从立体知觉出发,研究立
词汇语义知识库是语义分析的基础,目前词汇语义知识库构建仍是基于手工的方法。本文分析了HNC、HowNet和CCD语义词典的来源、对概念的描述体系和词典的组织结构,阐述了三者在
流数据挖掘中的一项重要任务就是挖掘序列模式,其目的是在流数据中挖掘出所有满足最小支持度的频繁序列。流数据中序列模式的挖掘的应用十分广泛,包括网络流量访问日志分析,w
教学的科学性依赖于对学习过程的深入理解,研究人类概念学习过程对提高教学的效率和效果起着重要作用。定义性概念是具体学科教材知识的基本单位,定义性概念的学习是具体学科
2009年我国的3G网络正式在市场上投入使用,原本因2G时代网络速度缓慢而无法大规模普及的移动互联网应用的数量快速增长,很多嵌入式系统设备也向移动信息终端、应用终端转变。
现代GPU计算能力的快速增长,使得它越来越适合于大规模问题的计算。CUDA(Compute Unified Device Architecture,统一计算设备架构)技术是一种将GPU作为数据并行计算设备的软
近年来医学技术和骨科临床医学紧密结合,极大的促进了骨科临床诊疗技术的发展。针对不同的骨科疾病,通过医学图像处理极大程度提高了手术治疗的准确性和安全性。有限元分析是
当前的社区选举活动中,选举模式的生成以人工制作为主,在短时间、大批量上会服务时,人工操作繁琐,模式制作过于耗时且易出错。因此,研究一种自动识别选票图样并自动生成选举模式的
颅面复原是一种对人类的颅骨进行面部容貌复原的技术,该技术以人类学、法医学、解剖学中的头骨与面貌相互关系规律为科学依据,广泛应用于考古、刑侦等领域。其中颅骨配准是计
Ad hoc网络是由一组带无线收发装置的移动终端组成的一个多跳的临时性自治系统。由于它不依赖固定的基础通信设施,没有中心控制节点,抗毁性强,因此适用于许多网络布线存在困