大规模视觉特征高吞吐检索算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:aidanzeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高吞吐的特征检索对于大规模视觉特征检索意义重大。研究人员对R*树索引、局部敏感哈希算法、倒排索引方法等进行了大量的研究。但是,随着数据规模的增长,现有算法仍面临性能急剧下降的问题。本文深入分析了局部敏感哈希算法在特征规模增大时性能下降的原因,提出对特征数据进行划分,进而分块索引的思想来提高特征检索的吞吐率,取得了如下主要研究成果:  1.提出了视觉特征数据划分及索引方法。针对数据划分所涉及的分块数、划分依据和划分方法等问题进行了深入分析和实验对比,针对直方图和Gist两类典型视觉特征数据,提出了两套划分方法,并使用信息熵和K-L散度对算法的性能进行评价;基于划分后的数据分块分别建立局部敏感哈希索引。实验结果表明,该数据划分方法能够使得局部敏感哈希算法在千万规模数据集上的检索速度平均提升55%左右,而召回率仅有较小的损失。  2.针对数据划分方法导致的召回率降低问题,提出基于查询数据和查询范围的两种查询扩展策略,一是通过检测可能的排序结果变化,将一条查询扩展为多条。二是依据计算查询数据与划分数据中心的欧式距离,确定查询扩展的范围。实验结果表明两种查询扩展方法能够召回率分别提升4.30%和2.86%。  3.基于上述成果,本文研发了一套面向多处理器平台的大规模视频检索系统,对算法的性能进行验证。表明上述成果可有效提高大规模特征检索的吞吐率。此外,本文利用NUMA架构本地访存更快的特点和局部敏感哈希算法在分块数据上的检索性能优势,通过将不同分块索引检索绑定到不同CPU核上,进一步提升检索速度,实验表明,此方法可以获得额外的10~30%的速度提升。
其他文献
随着计算机网络的迅速发展,网络管理越来越重要,SNMP在其中扮演着重要角色。网络管理在我国的应用处于起步阶段,本论文针对国内中小型网络的网络管理,对SNMP协议框架、网管系统的
定量分析土壤显微图像是图像处理技术和分析技术应用的一个领域.该文通过开发土壤显微图像处理系统,探讨处理土壤显微图像的各种技术.作者首先介绍了珠江三角洲地区饱和粘土
软件质量一直是软件领域中的研究热点,大多数软件失败都和软件的质量有关。随着软件系统越来越复杂,基于体系结构的开发模式成为当前开发软件的主要模式,因此对体系结构的分析和
随着供电系统中各种类型的非线性负荷的不断增加,电网中的谐波含有率变得越来越高,由谐波产生的各类事故也呈不断上升的趋势。因此有必要对电网中的谐波含量及非线性用电设备可能产生的谐波畸变进行检测,掌握谐波的产生和分布情况,以便采取措施抑制谐波危害,提高供电质量。本文介绍了一种基于8051的在线式远程谐波监测系统,并对该系统的构成和相关技术问题进行了分析研究。 本文就谐波计算的算法,谐波计算精确性的
该文将基于特征的领域分析方法(FODA)引入到领域软构件语义分析过程中,提出了一种可扩展的电子商务领域构件语义特征描述框架,并结合软件构件的语法形式表示,提出了一种面向
学位
该课题就是研究当前Internet上的主流路由协议——OSPF.OSPF的机制,OSPF的实现和OSPF在网络拓扑发现上的应用.在研究探讨了OSPF路由协议的理论和实现的同时,提出了路由协议服
本文全面地介绍了基于互联网的民航售票系统的分析与设计技术及内容。分析了浏览器/服务器(Browser/Server)模式的网络体系结构,并采用了目前先进的开发工具Java Server Pages(J
在信息爆炸的今天,如何及时、高效地从远程分布、自治、而且通常是异质的多个信息源集成需要的信息到客户端变得越来越重要。数据集成技术正是为了解决这一课题而提出的一种有
深度学习已经成为解决机器学习问题的重要手段。在图像分类,语音识别,文本翻译等领域,深度学习都取得了很好的效果。由于训练精确的模型需要具有大量参数的深度神经网络和海量的