论文部分内容阅读
基于内容的图像检索(Content-based Image Retrieval,cBIR)是当前的一个热点研究领域。论文首先对CBIR作了总体的介绍,包括CBIR的起源、系统模块、研究现状,原型系统、研究机构及相关的国际刊物和国际会议。然后针对CBIR中当前存在的主要问题,在理论和算法上对底层特征、维数灾难、语义特征及相关反馈问题进行了深入的研究。在实际应用方面,主要研究了CBIR技术在农业病虫害远程诊断中的应用,该研究对促进该领域的智能化发展具有重要的意义。
本文的创新之处主要体现在以下五个方面:
1、在底层特征描述方面,提出了彩色共生矩阵特征的改进方法一加权彩色共生矩阵特征。在深入讨论了CBIR中常用底层特征的演化轨迹之后,在详细分析了彩色共生矩阵特征及改进的彩色共生矩阵特征的基础上,论文提出了加权共生矩阵特征,即在构造全局相似度时,对角线元素和非对角线元素的相似性赋予不同的权重,而权重的大小就取决于图像的视觉复杂度。实验证明加权彩色共生矩阵特征使得图像库中和查询图像具有相似颜色和视觉复杂度的图像将变得更加相关,而和查询图像不具有相似颜色和视觉复杂度的图像和查询图像将变得更加不相关。
2、在维数灾难问题方面,首先将有监督的局部线性嵌入方法用于图像检索中的特征降维。由于有监督的局部线性嵌入(SuperVised Locally Linear Embedding,sLLE)算法在降维的同时可以保持局部领域的线性特性,使得高维空间中相邻的样本在低维空间中仍然相邻,论文将SLLE算法用于对底层高维特征进行降维。实验结果表明降维后的特征在检索准确度上具有更好的表现。其次在用特征选择方法解决维数灾难问题方面,提出了一种基于图像复杂度参数的特征选择方法。特征中被选择维数的确定是基于图像视觉感知的,它根据图像特征的每一维在不同图像范围中的统计频率得到的,因此选择后的特征维数不是一个常数,它是根据查询图像的不同而不同。从实验结果可以看出经过选择后的特征在检索准确度上有了一定的提高,同时大幅度降低了特征的维数和查询的时间,减小了算法复杂度。
3、在矩阵分解算法方面,提出了非负矩阵分解算法(Non-negative MatrixFactrization,NMF)的改进算法一有监督的非负矩阵分解算法(SNMF)。标准的非负矩阵分解算法是一种寻找全局数据基于部分表示的有效方法,但是它在应用中会存在两个问题,一个是随机初始化的问题,另外一个是基空间的维数问题。论文提出了一种有监督的非负矩阵分解算法来解决这两个问题。在这种算法中,对初始的基矩阵采用概念向量矩阵进行初始化,不仅使得非负矩阵分解算法可以更加快速有效的收敛,同时也确定了基空间的维数。理论分析和实验结果表明了有监督的非负矩阵分解算法在寻找全局数据基于部分的表示时提供了一个有限制同时又有弹性的起点。
4、在寻找从底层特征到高层语义的映射方面,提出了基于SNMF的隐含语义索引方法。论文对隐含语义索引技术(Latent Semantic Indexing,LSI)技术进行了深入的研究,在分析了基于奇异值分解(Singular Value Decomposition,SVD)的LSI技术在图像检索中应用的缺点后,根据NMF算法的非负性特点及基矩阵的意义,并考虑到标准的NMF在应用中存在的问题,论文提出了基于SNMF的隐含语义索引方法,用SNMF作为SVD的替代算法来推导图像中隐含的语义结构,从而寻找底层特征与高层语义间的联系。实验结果表明所提出的方法要优于基于SVD的隐含语义索引方法。
5、在相关反馈方面,提出了基于NMF的相关反馈方法。在详细讨论了目前相关反馈技术的发展,并在对现存方法总结的基础上提出了基于NMF的相关反馈方法,这种方法不仅利用了NMF在推导隐含语义空间方面的优势,同时可以长期记忆保存用户多次交互的信息,不断积累知识,这一点和人对图像内容的理解过程是一致的,实验结果表明该方法可以用较少的反馈次数达到较好的检索效果。