基于多源大数据分析的图像检索技术研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:shan12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,信息科学技术在高速发展的同时也在改变人类的生活方式,人们在互联网上分享各种图像,每天都会有数以亿计的图像上传到网络上。如何从这些海量的图像中快捷、有效地检索出用户需要的图像是当今一个重大研究课题。图像标注作为实现图像检索的重要环节,在图像检索系统中扮演着举足轻重的角色。本文研究了图像检索技术的发展和最新成果,重点研究了基于文本的图像检索系统的技术特点和当前主流的互联网检索系统。针对当前检索系统面对图像标注不足时,查全率较低的问题,提出了一种基于多源大数据融合的图像标注框架,该框架首先利用多源信息融合使图像的标注更丰富完整,其次运用深度学习对图像进行场景高层语义标注,最后,将两种标注融合起来,解决图像标注的深度和丰富程度不足的问题。首先,本文提出一种基于多源大数据融合的标注模型,该模型通过分析图像的相关多源信息,得到相似图像,利用相似图像的标注对图像进行标注。该模型解决了互联网图像文本不足时不能被检索的问题,在后文中将具体的介绍对图像多源信息的具体分析方法。最后,在微博图像这一特定场景中验证了该模型能很好地提升图像标注的深度和丰富程度。其次,本文提出了一种基于深度学习的图像场景标注模型,该模型通过场景图像中的关键对象和背景特征对场景进行识别。通过在fast RCNN网络上进行改进,构建了基于深度学习的图像场景模型,该模型经过大量的数据集训练后,能准确地对图像进行场景标注。在后文中将详细介绍该模型的具体框架、实现和训练,并且在标准的场景识别数据集上实验验证了该模型对于场景识别具有优异的准确性。最后,本文将前文提出的两种标注模型融合,运用爬虫技术、分布式存储技术、深度学习技术设计并实现了一个基于Web的图像检索原型系统。
其他文献
目的评价术前白蛋白-胆红素(ALBI)分级与肝细胞癌(HCC)患者术后预后价值的关系。方法计算机检索PubMed、The Cochrane Library、EMbase、Web of Science、知网、万方、维普数
紫砂壶“山中情”的设计创作灵感是在游览宜兴的竹海,见到一望无际苍翠的竹林时产生的,竹林中的春笋破土而出时那种生机勃发的场景在壶上得到体现,是一个非常有意义的创作。
保障能源安伞和有效应对气候变化是国际社会的共识,作为最大的发展巾国家,我国在工业化利城镇化的进程中对能源消耗和二氧化碳排放空间的需求依然巨大。如俐在总量大、增速快的
临南油田的的开发成本比其它油田相比普遍偏高,本文对开发高成本的原因从地面、地层几个方面进行了详细的剖析,包括高矿化度的腐蚀性对套管的影响,油井偏磨,措施费用,低渗油