论文部分内容阅读
近年来,信息科学技术在高速发展的同时也在改变人类的生活方式,人们在互联网上分享各种图像,每天都会有数以亿计的图像上传到网络上。如何从这些海量的图像中快捷、有效地检索出用户需要的图像是当今一个重大研究课题。图像标注作为实现图像检索的重要环节,在图像检索系统中扮演着举足轻重的角色。本文研究了图像检索技术的发展和最新成果,重点研究了基于文本的图像检索系统的技术特点和当前主流的互联网检索系统。针对当前检索系统面对图像标注不足时,查全率较低的问题,提出了一种基于多源大数据融合的图像标注框架,该框架首先利用多源信息融合使图像的标注更丰富完整,其次运用深度学习对图像进行场景高层语义标注,最后,将两种标注融合起来,解决图像标注的深度和丰富程度不足的问题。首先,本文提出一种基于多源大数据融合的标注模型,该模型通过分析图像的相关多源信息,得到相似图像,利用相似图像的标注对图像进行标注。该模型解决了互联网图像文本不足时不能被检索的问题,在后文中将具体的介绍对图像多源信息的具体分析方法。最后,在微博图像这一特定场景中验证了该模型能很好地提升图像标注的深度和丰富程度。其次,本文提出了一种基于深度学习的图像场景标注模型,该模型通过场景图像中的关键对象和背景特征对场景进行识别。通过在fast RCNN网络上进行改进,构建了基于深度学习的图像场景模型,该模型经过大量的数据集训练后,能准确地对图像进行场景标注。在后文中将详细介绍该模型的具体框架、实现和训练,并且在标准的场景识别数据集上实验验证了该模型对于场景识别具有优异的准确性。最后,本文将前文提出的两种标注模型融合,运用爬虫技术、分布式存储技术、深度学习技术设计并实现了一个基于Web的图像检索原型系统。