【摘 要】
:
随着大数据时代的到来,互联网中的数据呈爆炸式增长。在海量高维的数据中,实现快速最近邻搜索具有重大的现实意义。哈希算法因其快速有效性成为近邻搜索技术中的研究热点。哈
论文部分内容阅读
随着大数据时代的到来,互联网中的数据呈爆炸式增长。在海量高维的数据中,实现快速最近邻搜索具有重大的现实意义。哈希算法因其快速有效性成为近邻搜索技术中的研究热点。哈希算法的基本思想是把特征空间中高维的数据映射成汉明空间中低维的二进制码,并在汉明空间中保留特征空间的相似性。本文首先研究了锚图哈希算法,锚图哈希算法把数据转换成特征空间的节点,通过选取少量的锚节点,并以节点和锚节点的相关性近似表示节点之间的相关性,从而降低了拉普拉斯矩阵特征值和特征向量的计算复杂度,提高了哈希算法的有效性。然而,锚图哈希算法通过节点在特征空间中的欧式距离表示相关性,没有考虑到节点之间的语义相关性。针对此问题,本文提出了基于语义一致性的锚图哈希算法,通过利用节点标记信息,以半监督的方式,对距离度量进行学习,以得到优化的转换矩阵来计算节点间的相关性,并通过随机梯度下降方法进一步降低开销。同时,本文介绍了两种距离度量学习方案:遍历三元组方案和不遍历三元组方案,其中不遍历三元组方案以性能略微下降为代价换取训练耗时的较大缩减。最后,通过大规模公开图片数据库对算法的性能进行了验证,在多个指标上验证了本算法的优越性。
其他文献
现在大数据技术已经深入到了很多行业中,所以大数据的相关技术同样可以应用在卫星通信方面。同时伴随着便携式卫星通信地球站的使用越来越普及,其产生的数据量也越来越大,进
近年来随着第三代移动通信的迅猛发展,全球移动用户的急剧增加,3G业务的飞速发展,以及系统容量的不断增加,用户对上行数据业务传输速率提出了更高的要求。因此,在时分同步码分多址
TD-LTE(Time Division-Long Term Evolution)技术作为TD-SCDMA(Time Division-Synchronous Code Division Multiple Access)技术的未来演进方向,无论是在系统容量还是在数据速
无线通信技术发展日新月异,各种层出不穷的无线接入技术和通信网络共同为用户提供了多标准,多协议,多服务的异构移动通信环境。异构环境下业务的融合,网络的融合,终端的融合将成为
移动互联网被视为互联网技术与移动通信技术的结合体,具有移动性、私密性、融合性等特点,它的出现催生了一系列新型产业形态和商业模式,同时作为其内容的主要呈现设备,移动智能终
高速导弹制导雷达对地面或海面等复杂背景中的静止或慢速运动目标进行检测必须采用成像技术,制导雷达的搜索范围一般为飞行方向的前方区域,前视真实孔径成像以及成像过程中的运
随着嵌入式技术的不断发展,在嵌入式应用的不断增长以及嵌入式系统复杂性不断提高的情况下,调试阶段在整个系统开发过程中所占的比重越来越大。调试环境和调试技术直接影响软件
光突发交换被认为是未来很有前景的一种光交换技术,但由于缺乏成熟的光缓存技术,光突发交换存在突发竞争问题。竞争的结果只有一个突发包能够顺利传输,而其它竞争的突发包被丢弃
为了提升系统吞吐量、改善小区边缘用户的通信,LTE-Advanced中引入了中继技术。中继技术的引进使LTE-Advanced系统面临资源需求增加、干扰复杂化的问题,必须设计有效的资源分配