大规模图像检索方法研究

来源 :清华大学 | 被引量 : 2次 | 上传用户:jimmil
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模图像检索在实际场景中有广泛应用,如互联网图像检索、安防监控图像数据检索等,其所涉及的相关问题也是人工智能等领域的重要研究内容,在很长时间里都是学术界和产业界广泛关注、极具理论与实际价值的前沿方向之一。“图像特征检索”(利用图像的视觉特征进行图像间的检索)和“图像语义检索”(利用图像的语义信息实现图像与语义标签间的检索)是图像检索的两类主要任务。对于图像特征检索,图像本身的“多特征”特性需要准确的跨异构特征空间匹配方法来解决;而在大规模图像环境下,需要处理的数据量大、噪声多、场景复杂,需要高效率、高鲁棒性、高通用性的相似性计算方法。图像语义检索的基础是为每个语义构建的图像语义抽取模型。但现实场景中,往往面对语义多样、稀疏、分布不均匀等挑战,很多语义类别缺乏、甚至没有标注数据来训练模型,即“少样本”、“零样本”学习难题。针对上述挑战,本文提出以下创新点:第一,针对图像“多特征”特性带来的跨异构特征空间相似性匹配难题,提出联合矩阵分解哈希框架。与已有框架相比,该框架能够更好地建立不同模态之间联系,实现更准确的跨模态匹配。该框架在无监督和有监督场景进行推广,得到的方法在对应的场景中均有优异的性能。第二,针对图像特征检索面临的数据量大、噪声多、场景复杂等挑战,提出鲁棒通用向量量化框架,利用向量量化实现高效率,并创新性地提出基于?p,q范数的量化损失函数,提升鲁棒性和通用性。并提出一种优化方法系统性地解决了正交约束的?p,q范数最小化问题,并从理论上证明了正确性。在多个标准数据集上的实验表明,该框架显著提升了多种向量量化方法的鲁棒性与通用性。第三,针对图像语义检索中的零样本学习难题,创新性地提出基于样本迁移的零样本学习框架,利用图像数据具有的“类标缺失”、“标签模糊”等特性,为缺少有标注数据的目标类别寻找“伪标注”数据,并利用其进行模型训练。该框架将零样本学习问题转换为一个有监督学习问题,打破了零样本学习的束缚,开辟了新的思路。该框架在多种场景下普遍适用,准确率较已有方法显著提升。第四,在零样本学习基础上,进一步提出“跨类别迁移主动学习”理论概念,并设计多种方法,通过在海量类别之间进行知识迁移,并迭代式地选择最有信息量的数据进行人工标注,实现在节省70%人工标注的情况下,构建准确率相当的语义抽取模型,为大规模图像语义抽取与语义检索的实用化奠定了坚实基础。
其他文献
在肯定地铁设备国产化能降低地铁工程造价的同时,指出设备国产化后不可能彻底解决地铁造价过高的问题。只有在搞好设备国产化的同时,搞好轨道交通规划,优化设计方案,分阶段投
随着科学技术的不断发展,现代移动信息技术已经被应用到高职院校的教学当中,手机移动技术的作用在课堂上得到了重视和广泛的应用。本文主要以手机蓝墨云班课APP为例,分析了现
为了研究牛磺酸对蛋鸡生产性能及蛋品质的影响,试验采用32周龄的产蛋高峰期健康罗曼粉蛋鸡84只,随机分为4组,每组3个重复,每个重复7只鸡。对照组蛋鸡饲喂不含牛磺酸的基础日
微信营销是网络经济时代企业营销模式的一种创新,它是一种随着微信的崛起而兴起的网络营销模式。微信不存在距离的限制,企业可以通过点对点的营销推广自己的产品。随着社会转
在我国,土地是地方政府控制的最重要的资源和资本,地方政府的土地相关收益是地方财政的重要来源,因此地方政府行为对城市土地配置效率和城市的发展有着至关重要的影响。地方
程泰宁先生给人留下印象最深刻的,与其说是对建筑的阐释,还不如说是他对事物独特的思考与看法。无论是谈论当下城市文化,还是回忆个人一路以来的思考与设计实践,他都在叙述中
选择生长发育正常的绿壳蛋鸡15 000只,随机分成笼养高密度组、笼养低密度组和散养组,每组又分为对照组和实验组,2 500只/组。对照组饲喂正常日粮,实验组饲喂添加0.1%的牛磺酸
<正>本文所说的"中国现代美学"在时间跨度上主要指19世纪末20世纪初至20世纪40年代。而在学科的意义上,"中国现代美学"很大程度上是二十世纪初叶由王国维、梁启超、蔡元培等
会议
目的了解青少年核心自我评价、积极情绪和生活满意度的关系。方法采用核心自我评价量表、积极情绪量表和生活满意度量表对280名青少年进行测试。结果相关分析发现核心自我评
随着对汽车钢板强塑性能要求的提高,先进高强钢从以双相钢、相变诱发塑性钢为代表的第一代先进高强钢,以孪晶诱发塑性钢为代表的第二代先进高强钢,发展到目前以淬火-配分钢和