高维数据下近似K近邻查询的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:XHR
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的迅速普及,人类日常生活产生的数据也越来越大。数据的爆炸不仅体现在数据量上的增长,也体现在数据维度上的增长,在高维数据上的一些操作成为越来越重要的研究课题,比如本文关注的近似近邻查找问题。本文中我们主要针对于高维数据空间下的近似近邻查询问题进行了较深入的分析与研究。对近似近邻查找领域的查询感知的检索方式进行了一系列优化与改进。具体的工作有以下两点:对于近似近邻搜索,查询感知LSH是一种非常新颖的检索方式,这种方式不同于一般LSH中所使用的直接哈希分桶,它是通过先确定哈希投影再确定检索范围的方式,使得查询效果明显提升。本文首先对查询感知LSH进行改进,通过改进算法中的一些缺陷然后结合使用谱方法进行哈希,使得算法在时间和IO性能上都得到了一定的提升。深度哈希是基于深度神经网络的一类哈希算法,我们希望借助神经网络来建立一种优秀的哈希结构。我们首先提出了一种新的激活函数,然后建立了一种卷积自编码器网络结构,并提出了适用于该类网络的预训练方法。通过神经网络强大的表示能力,将数据哈希降维到低维数据,得到了非常精简的编码。最后我们联合深度哈希和查询感知检索方式,建立了一个基于深度哈希的近似近邻检索模型。虽然离线训练模型需要占用一定时间,但是这种方式缩短了在线处理时间和并且可以得到更加优良的检索结果。最后在公开数据集上的实验表明我们提出的激活函数和训练策略都非常有用,同时我们在实验中证明了卷积自编码器网络的高效性和实用性。
其他文献
基于2015年中国城乡老年人生活状况抽样调查北京数据,探讨老年人住房满意度和影响因素。总体来看,大部分老年人对调查时住房条件持满意或一般的态度。农村老年人的住房满意度
随着人们法治观念和权利意识的增强,司法审查已涉及高校领域, 学位授予这类关系到相对人权益的行政行为更是引起司法部门和社会的广泛关注。在这种背景下,从法理的角度对学位
互联网的兴起与普及使得经济运行的规则和商业竞争环境发生了翻天覆地的变化,涌现出很多新的商业模式。随着科学技术的发展,一批新企业诞生。许多企业利用网络思维成功地改变
文章梳理了媒介与传播形态的紧密联系,分析了新闻传播的分享化与社交媒体的关系,提出了对分享化趋势的几点思考。
面对全球性的生态环境危机和我国社会经济发展遇到的生态环境瓶颈,我们到底需不需要马克思?这既是一个重要的理论问题,也是急需回答的现实问题。近年来,关于环境问题的理论研
目的:研究改良左侧低位腹膜透析置管术对发生导管漂管并发症的影响。方法:此研究中纳入了2010年11月至2016年9月在我肾脏内科诊治的需肾脏替代治疗的终末期肾病患者,选择腹膜
瑶族民歌极具地方特色,在清代就已经有诗人开始称赞它了。瑶族民歌纯属瑶族人民的生活品,是瑶族人民在生活、工作过程中用口头即兴创造出来的歌曲,是瑶族的重要艺术文化,也是
<正>目的通过制定和使用脑复苏监测记录单并增加体温监测与干预频数,探讨其对低温治疗质量的影响。方法采取前瞻性设计历史对照的研究方法,观察2009-01~2012-12期间收住我院I
会议
目的:应用口外弓联合唇挡推下颌磨牙远移,观察远移后牙颌变化。方法:对11例平均年龄10.6岁,骨性Ⅰ类牙性Ⅲ类关系的替牙期及恒牙初期患者行口外弓联合唇挡推下颌磨牙远移,取