论文部分内容阅读
基于内容的图像检索技术(CBIR),是计算机视觉领域的一个研究热点。传统的基于内容的图像检索方法,提取图像的颜色、形状和纹理等底层特征来建立索引,并进行图像检索。但是,这种基于整幅图像特征的图像检索方法存在着底层图像特征与高层语义之间的语义鸿沟问题。本文将视觉注意机制引入到传统的基于内容的图像检索系统中,研究了基于视觉注意的图像检索技术:利用视觉注意模型,提取图像中对人类视觉吸引程度较大的区域作为图像的显著区域,并对这些显著区域提取相应的特征进行检索。本文给出的基于视觉注意的图像检索方法在一定程度上,缩小了图像的底层特征与高层语义之间的鸿沟,在所进行的一系列实验中取得了较好的检索结果。本文的主要研究工作如下:1)首先,总结了基于内容的图像检索技术和视觉注意技术的研究现状,并分析了基于内容的图像检索系统的总体框架,及其关键技术。在此基础上,指出了传统的基于内容的图像检索系统所存在的不足,并引入视觉注意模型,构成基于视觉注意的图像检索。2)其次,概述并分析指出几种经典的显著性检测模型所存在的问题,并结合频率调谐显著性检测方法和区域对比度方法的优点,给出了一种新的区域级显著性检测算法:基于频率调谐的区域显著检测算法。该算法既考虑了图像的频率域信息,也考虑了图像中各区域之间的空间位置关系对显著度的影响,实验表明该区域显著性检测算法能够有效地检测到图像中显著区域。3)然后,在分析传统图像搜索引擎的原理和结构的基础上,将视觉注意技术引入到传统的图像搜索引擎中,设计了一种基于视觉注意的图像搜索引擎。相对于传统的图像搜索引擎,本文给出的基于视觉注意的图像搜索引擎,可以提高后续图像检索的执行效率和准确率。4)在前两部分的基础上,设计并实现了一种基于视觉注意的图像检索系统,并分别在两种图像数据库下进行了系统测试和评价。本文设计实现的基于视觉注意的图像检索系统能够较为准确地提取查询图像的主要显著区域,在一定程度上克服了语义鸿沟,其查准率和查全率优于传统的基于整幅图像特征的图像检索方法。