基于弱监督深度学习的图像检索方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:napone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索一直是学术界的研究热点问题。其核心问题是,如何让计算机像人一样准确地理解图像的含义。近年来,深度学习技术在图像上的应用取得了瞩目的成绩,涌现出一批基于内容的图像检索(CBIR)系统,如百度识图等。“卷积神经网络+哈希学习”已成为解决图像检索最有效的方法之一。然而,现有的系统(如百度识图)多采用有监督学习训练神经网络,以高昂的人力标注成本换取神经网络的优异表现。另外,传统的无监督学习技术不能很好地反应图像高层次语义信息,因此较少被图像检索模型采用。随着移动互联网的快速发展,如果能够利用大规模用户主导产生的弱标注数据实现图像检索将会节约大量人力标注成本。但是,尽管弱标签数据含有图像的语义信息,其中仍存在非视觉性语义标签和标签含义模糊(同义词、一词多义)等问题。本文提出一套弱监督学习框架,利用用户产生的弱标注信息训练神经网络。具体步骤如下:一、本文使用词袋(BoW)模型将图像表示为向量形式,通过形成视觉词袋模型,计算每个标签对应图像集的TF-IDF向量的内聚距离、分离距离,通过比对标签间TF-IDF向量质心距离的大小,去除非视觉性语义标签。二、通过将标签表示为语义词向量来计算图像之间的语义相似关系,形成相似对和不相似对集合。三、根据语义相似关系训练卷积神经网络(CNN)。本文的CNN模型输出层为图像的哈希编码。训练目标为:让语义相似的图像对的汉明距离尽量接近,而语义不相似的则相互远离。通过动量梯度下降算法迭代更新目标函数。将图像映射为哈希码后,通过比对图像间的哈希码实现快速图像检索。本文使用MAP、Precision等度量方法在NUS-WIDE测试集上进行实验以验证提出的图像检索方法的性能。与BRE-CNN、LSH、ITQ、DSCH等先进算法做对比分析,结果表明,本文提出的基于弱监督哈希函数的卷积神经网络(Weakly-Supervised Hash CNN,WSH-CNN)方法在检索的精确度上优于上述几种方法。
其他文献
珠心算以其独特的计算方式在提高人的智商方面起着神奇的作用,因而在世界各地很受欢迎,并呈现出良好的发展势头。那么珠心算对人的智力开发和智商
期刊
我的朋友胡文辉。去年把陈寅恪的全部诗都笺证出来,承他不弃,送我一部完整的打印稿。我在一年的时间里,断断续续读完了。今年八月间,我在北京的“布衣书局”里乱翻书,偶然看到一册
一九八三年,我担任台湾淡江大学中文系主任时,偶过学校图书馆,看见工人正在清理杂物,以板车将一些废置不用的桌椅文具拉走,其中有一大堆破旧杂志弃纸。我跑去把那些废纸翻出来,大大
1月12日,国机重工(洛阳)有限公司2017“专业专注高品质和衷共济新发展”营销网络商务年会在新落成的产业园成功举行。
近期,24台崭新的三一SY215挖掘机运抵印尼苏拉威西岛,参建印尼青山工业园新一期工程。目前,在这个备受瞩目的项目上,有近600台三一挖掘机挥舞“臂膀”,全速推进项目进度。作
调味品是否变质,首先从气味判断林女士喜欢烹饪,但令她烦恼的是,各式烹饪需要用到不同的调配料,而这些配料每次只用少量,但买的时候必须整包、整瓶购买回家,目复一日,厨房里堆满了各
根据压实机械行走驱动的特性研究,重点以全驱型单钢轮压路机智能电子液压系统的直行模式及爬坡模式的系统设计分析,在建立电子液压驱动系统的设计原则情况下,进行不同工况驱
205年12月25日,七台河市新兴区召开2015年珠心算与数学知识整合教育工作阶段总结会。全区各小学校长、珠心算教导主任、优秀珠心算教师和班主任代表,以及优秀珠心算选手代表,共
美国伊利诺伊大学生物实验室的鱼缸里,养着一群三刺鱼鱼苗,它们是一项特殊研究的观察对象。做实验时,研究人员将一只只三刺鱼逐个放入单独的小型鱼缸中,并用摄像机进行全程记录。
芭芭拉从冰箱拿出一袋爆米花,放进微波炉里,然后,它将一张DVD碟片推入播放机后,亲昵地靠在文森特·克雷格尔——这个在生活中最需要它的男人身旁,一起看着电视机屏幕。几