基于视觉注意的图像检索技术研究

来源 :南京大学 | 被引量 : 2次 | 上传用户:me272206010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索技术(CBIR),是计算机视觉领域的一个研究热点。传统的基于内容的图像检索方法,提取图像的颜色、形状和纹理等底层特征来建立索引,并进行图像检索。但是,这种基于整幅图像特征的图像检索方法存在着底层图像特征与高层语义之间的语义鸿沟问题。本文将视觉注意机制引入到传统的基于内容的图像检索系统中,研究了基于视觉注意的图像检索技术:利用视觉注意模型,提取图像中对人类视觉吸引程度较大的区域作为图像的显著区域,并对这些显著区域提取相应的特征进行检索。本文给出的基于视觉注意的图像检索方法在一定程度上,缩小了图像的底层特征与高层语义之间的鸿沟,在所进行的一系列实验中取得了较好的检索结果。本文的主要研究工作如下:1)首先,总结了基于内容的图像检索技术和视觉注意技术的研究现状,并分析了基于内容的图像检索系统的总体框架,及其关键技术。在此基础上,指出了传统的基于内容的图像检索系统所存在的不足,并引入视觉注意模型,构成基于视觉注意的图像检索。2)其次,概述并分析指出几种经典的显著性检测模型所存在的问题,并结合频率调谐显著性检测方法和区域对比度方法的优点,给出了一种新的区域级显著性检测算法:基于频率调谐的区域显著检测算法。该算法既考虑了图像的频率域信息,也考虑了图像中各区域之间的空间位置关系对显著度的影响,实验表明该区域显著性检测算法能够有效地检测到图像中显著区域。3)然后,在分析传统图像搜索引擎的原理和结构的基础上,将视觉注意技术引入到传统的图像搜索引擎中,设计了一种基于视觉注意的图像搜索引擎。相对于传统的图像搜索引擎,本文给出的基于视觉注意的图像搜索引擎,可以提高后续图像检索的执行效率和准确率。4)在前两部分的基础上,设计并实现了一种基于视觉注意的图像检索系统,并分别在两种图像数据库下进行了系统测试和评价。本文设计实现的基于视觉注意的图像检索系统能够较为准确地提取查询图像的主要显著区域,在一定程度上克服了语义鸿沟,其查准率和查全率优于传统的基于整幅图像特征的图像检索方法。
其他文献
IP电话的本质特征在于语音分组交换技术,它将模拟语音进行模数转换、压缩编码、打包分组,然后基于分组交换网络进行传输,然后再通过解包解压缩处理恢复语音从而实现语音通信.
本文探讨了社保行业数据仓库建设的必要性和可行性,社会保险是我国信息化建设较为成熟的一个领域,经过十几年持续的建设,已基本形成了稳定的应用并积累了海量的数据,这就使建设以
随着软件系统愈来愈复杂,软件设计的核心已从"算法+数据结构"转向对系统总体结构的设计和规范,亦即软件体系结构这一层次上的设计.体系结构是软件系统的高层抽象,用于描述整
扩展标记语言(XML)是一种元标记语言。就像在广域网协会(World Wide Web Consoctium,W3C)的XML 1.0规范中所说明的,XML可以让用户定义自己的标记语言,从而可以在XML文档中描述
随着经济全球化和知识经济时代的到来,企业之间的竞争日益激烈,在这种情况下,企业如何提高自己的产品质量,降低质量成本,增加客户的满意度日益成为企业管理的重要内容.在质量
UML是一种在工业界得到广泛应用的系统建模语言.然而由于缺乏形式化的语义而限制了它向更广泛的应用领域发展.形式化语言虽以其精确语义著称,却无法从现实世界中直接获取模型
随着社会的发展,信息显得越来越重要,而信息安全则是社会广泛关注的问题,密码技术是实现信息安全的核心技术之一,它被广泛的用在军事、政治、商业、金融等领域,现在,越来越多的人用
该文首先介绍了移动IPv6和切换相关协议和技术,然后以平滑切换为切入点,通过分析移动环境下实时传输的要求,提出移动IPv6平滑切换需要解决的问题.针对这些问题,该文研究和设
移动Ad hoc网络是一种由无线移动主机/节点组成的动态自治网络,具有不需要使用固定基础设施的特性.可以用于没有无线设施存在或出于费用和安全方面的考虑不方便设置无线设施
进入二十一世纪以来,信息技术以更加迅猛的速度飞速的向前发展,软件产品在社会各个领域的应用也越来越广泛,软件产品的质量自然成为人们共同关注的焦点。不论软件的生产者还是软