基于二进制局部特征的大规模图像检索技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:crp123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展为用户提供了大量的图像资源,如何从海量的图像资源中获取自己感兴趣的图像成为急需解决的问题。基于内容的图像检索技术是解决上述问题的有效手段,与传统的基于文本的图像检索不同,基于内容的图像检索直接分析图像的视觉特征,在图像库中检索返回视觉特征相似的图像,更加直观和有效。本文获得如下研究成果:  1)鉴于主流二进制描述子仅基于灰度值比较,易受噪声影响,鲁棒性低,本文提出利用灰度值、灰度变化率等像素属性,并利用基于学习的属性选择算法选择描述能力较强的属性,进而生成一种基于多维属性的二进制描述子MBF。实验表明,MBF的描述能力相比传统二进制描述子提高10%,计算速度相比实值描述子提高近2个数量级。  2)传统的海明距离匹配效率低,不适合应用于大规模图像检索。本文提出一种面向二进制特征的分级匹配算法,其包括基于倒排索引的二进制索引(提高匹配速度)和辅助特征校验(提升检索准确率)两部分。相比传统海明距离匹配,本文提出的分级匹配算法匹配速度提升3个数量级,召回率提升3.5%,准确率提升3%。  3)为了解决大规模图像库特征数量多、占用空间大、检索缓慢问题,本文提出一种鲁棒特征筛选方法,在保证准确率基本不变,召回率小幅度下降的情况下,特征数量减少80%,检索速度则提升5倍。最后结合MBF、分级匹配算法和特征筛选方法,构建了一个大规模的图像检索系统,通过采用GPU的特征提取技术,在百万级图像库上,召回率82.6%,准确率为98.0%的情况下,平均单幅图像的特征提取和匹配耗时约23ms,达到了实时检索分析的要求。
其他文献
人类已经迈入二十一世纪,信息化、智能化已经成为当今的热门话题,无论是在金融、医疗、军事、教育等各领域都在实行着信息化、智能化的革新。如何运用先进的技术实现现代化的管
面向服务的体系结构是一个广泛应用于企业级软件架构的模式。它通过将不同功能抽象为服务,通过使用接口将服务与服务联系起来。这样的体系结构满足现今对功能解耦的需求。于
生物信息学是将数学、计算机科学等领域的科学理论、应用技术等应用于生物科学,以达到了解生物数据的目的的一种跨学科前沿科研领域。第一生产力的科技,已然成为改善人类的生活
信息化社会对软件系统日益增长的需求与依赖,以及软件规模及复杂度的不断增加加剧了软件的“可信”问题。开发满足客户需求的可信软件是目前软件业的巨大挑战。软件过程技术的
随着中国科学院科研信息化进程的加快,Academia Resource Planning3.0(ARP3.0)项目加快了中国科学院科研人员信息化办公的效率,然而,网上办公的信息量激增,文献和文字数量曾指数
全过程计算机辅助动画自动生成技术由中科院陆汝钤院士于上世纪90年代提出,这一技术的目标是将适当的故事以受限自然语言的方式输入计算机,由此开始一直到动画的生成,每一步都是
二十一世纪,人类进入大数据时代,大量历史数据的积累导致数据量高速增长,海量数据领域越来越被人们所重视,该领域涌现出了许多新技术。一方面,人们需要高效存储日益庞大的数据集;
比较是人们日常生活中常用的一种行为方式,对获取知识有重要意义。随着社会发展和技术进步,可获取的信息量与日俱增,通过对比分析能够得到的知识也更为丰富。但通过人工方式处理
学位
随着我国高等教育的飞速发展、教学改革的不断深入以及计算机技术在教学过程中的广泛应用,学校、老师和学生都对考试有了新的需求:学校希望有效地改进现有的考试模式,提高考试