论文部分内容阅读
随着多媒体数据库的不断发展,传统的图像检索方法已经再也无法满足图像检索的需要,基于语义的图像检索已经成为当前的研究热点。为了实现基于语义的图像检索,许多研究者将图像的底层视觉特征融合为图像特征向量,用支持向量机(Support Vector Machine,SVM)实现图像底层特征和高层语义的关联,这种关联的方法是借助于图像语义分类方法实现的。图像语义分类一直是计算机视觉领域研究较多的一个问题,它的主要目标是根据图像含有的内容把图像分为多个不同的类别,一幅图像可以含有很多物体,比如山,河流,天空,草地等,如何识别这幅图像含有的物体是图像语义分类的关键,也是提取图像语义信息的主要工作,这是计算机视觉的一大难点。在自然图像语义信息提取中,特征提取和分类算法是影响语义信息提取结果的两个主要方面。为改善自然图像分类效果,更准确和完整地提取语义信息,本文研究了训练集的优化方法、颜色信息与纹理信息的融合方法和提取图像语义内容的方法。
对自然图像分类时,使用结合颜色、纹理和边缘信息的组合特征可以提高SVM分类器的分类精度,但训练集的优劣才是影响分类精度的关键因素,本文使用密切关系传播算法(Affinity Propagation,AP)对SVM训练集进行优化。首先将训练集的图像均匀分割成若干图像块,然后计算每块的组合特征直方图,接着使用AP算法进行聚类,聚类之后的训练集是每类图像的代表块,这样不仅增大了训练集,而且得到的代表图像块消除了图像中的冗余信息,保留了图像的主要内容,从而优化了训练集。最后使用一对多SVM分类方法对测试图像分类,实验结果表明分类精度得到大幅度的提高,而且提取的语义信息更完善和准确。
对自然图像分类时,纹理分析有助于提高图像的分类精度。目前,在对自然图像纹理分类时,其他研究者直观地选择了最优的颜色空间进行分类,他们没有考虑到颜色空间对分类精度的影响。为此,本文提出衡量样本类的紧密性或者说是可分性的核散布矩阵测度,一个样本类的紧密性和可分性是相对的,紧密性越好,可分性越差,并利用此测度提出一种颜色空间选择模型:在十二个颜色空间中分别计算每类样本的核散布矩阵测度,并根据测度的大小选择对每类图像提取纹理特征应使用的颜色空间。这种方法可以为每幅图像纹理分类选择最适当的颜色空间。实验采用一对一SVM分类器测试这个模型的有效性,得到的分类效果明显优于其他任何一个颜色空间的分类效果。因此,将自然图像的颜色信息和纹理信息进行有效的融合可以提高分类精度,从而改善图像的语义信息提取效果。
本文的创新之处在于:
1.使用AP无监督学习算法实现SVM训练集的优化,使优化后的训练集在高维空间的分类超平面产生更大的分类间隔,从而改善了自然图像的分类效果和语义信息提取效果。
2.提出核散布矩阵测度和基于这种测度的颜色空间选择模型,并应用此选择模型实现自然图像纹理分类时颜色空间的自适应选择。这种方法有效地融合了颜色和纹理信息,大大提高了自然图像的分类精度。