监督哈希学习方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:za789321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展和移动设备的广泛普及,多媒体数据呈现爆发式增长的趋势。如何在大规模数据库中快速检索到查询数据的近邻变得愈发重要。哈希学习作为近似近邻检索的主要方法之一,因其在检索速度、存储开销等方面的良好性能而引起研究者的广泛关注。哈希学习大体可以分为无监督方法和监督方法两大类。相比于无监督方法,监督哈希学习方法通过引入类别标签、成对相似度关系和排序关系等监督信息,可以有效提升检索的精度,因此成为哈希学习研究的主要方向。近年来,监督哈希学习方法取得了一系列研究成果,但该领域的研究中仍存在许多不足和挑战。例如,如何在可接受的训练时间和训练存储开销的前提下,充分地利用标签信息并离散地学习样本哈希码;如何压缩大规模样本的哈希码长度,以便于进一步降低存储开销和检索时间;如何处理哈希学习算法因为参数初始化、局部最优解和参数设置不合理等带来的不稳定性,并提升哈希学习算法的精度。针对以上问题和挑战,本文对监督哈希学习方法进行了深入研究,分别从单模态哈希学习和跨模态哈希学习的角度提出了六种哈希学习模型。
  首先,在单模态哈希学习方面,针对现有监督哈希学习标签利用不充分问题和短哈希检索精度低问题,本文分别提出了基于双线性映射的监督离散哈希和监督短长度哈希:
  (1)针对现有哈希学习标签信息利用不充分,离散哈希学习的过程稳定性较差的问题,本文提出了基于双线性映射的离散哈希学习方法。该方法仅使用一个映射矩阵来描述哈希码与类别标签之间的相互回归关系,较好地保持了成对相似度信息,进而使学习到的哈希码更加稳定和精确。
  (2)针对短长度哈希码区分能力弱,信息损失严重,检索精度较差的问题,本文提出了短长度哈希学习方法。为了获得更好的性能,该方法将鲁棒和相互回归、矩阵分解、离散优化和平衡约束整合在一起,以学习更加稳定和准确的短长度哈希码。
  其次,给定一个单模态哈希学习模型,本文还提出了一种模型性能自提升方法:
  (3)针对因参数设置,优化方法选择不合理等导致哈希学习容易陷入局部最优解、算法不稳定的问题,本文提出了哈希学习模型性能自提升方法,并给出了一种适用于线性哈希模型参数自优化的方法,在不增加约束项或者惩罚项的前提下,可在一定程度上提高线性哈希学习算法的稳定性,且对深度哈希的研究具有较大的参考价值。
  进一步地,在上述单模态哈希学习方法基础上,结合模型性能自优化方法,本文又提出了一种增强短长度哈希学习方法:
  (4)为进一步提升短长度哈希学习的性能,本文提出了一个增强短哈希学习方法,该方法从增强短长度哈希码分类能力的角度出发,采用双向映射有效地利用标签信息,并利用非对称策略将成对相似度信息嵌入到哈希码学习的过程中。此外,该方法还提出了兼顾比特平衡性约束与独立性约束的模型增强策略来进一步优化哈希码的分布。
  最后,受上述单模态哈希学习算法思路的启发,在跨模态哈希学习方面,本文提出了两种跨模态哈希学习方法:
  (5)针对离散跨模态哈希学习算法具有不稳定性且时间复杂度高的问题,本文提出了基于标签回归的快速离散跨模态哈希学习方法。该方法通过学习从样本标签到哈希码的仿射变换,有效缓和了中心矩问题,提高了回归的稳定性,并显著降低了算法的时间复杂度。
  (6)为了进一步提升跨模态哈希学习的性能,本文提出了一个基于两步模型的跨模态哈希学习算法。该方法首先基于双线性映射来学习保相似性的哈希码表示,然后学习可以保持异构模态特征分布与语义相似度一致性的样本外扩展映射,较好地提升了跨模态检索的精度。
其他文献
图像超分辨率重建是深度学习的重要分支,受到越来越多科研人员的关注。目前,图像超分辨率重建方法以深度学习为基础在图像的定性和定量上取得了突破性的发展。为了提高图像的重建质量,现有的基于深度学习的图像超分辨方法一般都是通过增加网络模型的深度提高图像的重建质量。但是,实验也表明随着网络模型深度的增加,图像过渡平滑现象会越来越严重。除此之外,由于自然场景下真实低分辨率图像受到天气、噪声和模糊度等因素的影响
现有的图像修复方法,主要针对自然场景、建筑物等图像,对于人脸图像的修复并没有过多的深入研究。自然条件下的人脸图像的修复,会随着人脸姿势、遮挡、表情等因素而造成修复结果产生偏差,比如出现边界区域模糊、结构不连贯等问题。本课题着重关于人脸图像的修复展开研究,提出了基于人脸结构特征先验引导的图像修复算法,该算法通过在残缺人脸图像中使用卷积神经网络提取人脸结构潜在信息,然后通过人脸结构条件约束和重建隐藏层
学位
电商平台和网络社交媒体的快速发展,让我们的生活更加丰富多彩,获取信息也更加方便,但是随之而来的是信息过载给我们上网所带来的巨大影响。而推荐系统则在一定程度上减轻了目前信息爆炸的问题,也可以有效的帮助人们更加迅速的寻觅到他们所需的信息。但是,数据稀疏和冷启动等问题会对推荐的质量造成较大的影响,如何克服这两个问题也成为了诸多学者研究的目标。已有研究表明利用信任信息可以在一定程度上解决数据稀疏和冷启动的
随着云计算、大数据及网络等技术的快速发展,社会进入了信息化时代,各种信息系统成为人们日常生活的基础设施,人们的工作、学习、生活无不严重依赖于网络,信息安全日益成为焦点问题。密码学是信息安全的核心与支撑性技术,密码技术的应用对社会信息化的健康发展具有不可替代的作用。  信息化时代,数据规模不断扩大,巨大用户数量、海量数据规模、高并发处理性能,都对密码运算的加解密速度、数字签名和验证速度等性能指标提出
学位
估计图像中物体的三维位姿(位置和朝向)是计算机视觉领域的基本问题,在增强现实领域起着非常核心的作用。在增强现实环境中,系统需要实时跟踪现实世界中特定物体的位姿,才能保证渲染的虚拟物体与现实物体保持几何一致性。基于视觉的三维物体跟踪方法是实现连续跟踪物体位姿的关键技术,由于其具有非侵入式、准确和廉价的优点得到快速发展。随着智能移动设备的普及和其计算能力的提升,基于单目彩色相机的三维物体跟踪方法成为研
学位
激活函数作用是引入非线性到神经网络中,使神经网络可以更好地学习复杂的非线性函数,这是神经网络解决非线性问题的核心。激活函数的选取对于整个神经网络的训练起到十分重要的作用,如何选取激活函数会影响网络训练的时间和准确率。在现实处理器中,选取适当的非线性激活函数可以提高训练准确性,但是非线性激活函数的计算往往会消耗很大的运算周期。软件实现造成的延时会影响整个网络的训练效果,硬件层次的实现降低延迟同时存在
近年来,复杂网络研究引起了广泛的关注。现实生活中的许多基础设施都可以建模为复杂网络,如供电网络、交通网络和互联网等。大部分复杂网络并非是随机网络,而是呈现出一种特殊的结构。无标度网络就是一种特殊形态的复杂网络,它表现为少数的重要节点拥有大量的连接,而新加入的节点也会以较大概率连接到这些重要节点上。无标度网络因其“重尾”特性而表现得十分脆弱,因此会不可避免地出现各种故障。网络鲁棒性就是用来评估网络对
随着基本通信网络的发展,越来越多的物联网设备需要与用户进行交互。另一方面,由于物联网中的设备计算性能,内存存储性能和网络带宽资源都有限,所以提出MQTT的基于发布/订阅的轻量级数据传输协议,同时近几年随着物联网的发展,MQTT协议也被越来越多的用到物联网系统中,因此使用MQTT的进行传送的数据的安全性也被越来越多的讨论。  本文中提出了两个关于MQTT协议的安全性的相关方案,第一个方案基于物联网设
学位
近年来,随着社交媒体网站的大量涌现,分布在互联网上的多媒体数据内容呈现出爆炸式的增长。为了更全面地挖掘多媒体数据,帮助用户从海量且杂乱的数据中获取有价值的信息,大规模跨模态检索的需求与日俱增。与传统的单一模态的检索相比,跨模态检索可以大幅提升用户体验且更符合现实应用场景。但是互联网上的多媒体数据具有数据量大、数据结构复杂、数据维数高的特点,以及不同模态之间存在异构鸿沟和语义鸿沟问题,这对大规模跨模