【摘 要】
:
跨媒体检索,即输入一种媒体类型的数据,得到与之具有相似语义的多种媒体类型的数据。以往的跨媒体检索都是粗粒度的,只能检索出大范围的结果。而细粒度跨媒体检索则能够分辨子类别之间细微的差距,检索到更细微类别的跨媒体结果,因此细粒度跨媒体检索也可以称为跨媒体子类别检索。然而,细粒度跨媒体检索存在着以下两大挑战:(1)只在类别标签的弱监督作用下很难学习到细粒度子类别之间细微的差异,大大影响了检索的准确率;(
论文部分内容阅读
跨媒体检索,即输入一种媒体类型的数据,得到与之具有相似语义的多种媒体类型的数据。以往的跨媒体检索都是粗粒度的,只能检索出大范围的结果。而细粒度跨媒体检索则能够分辨子类别之间细微的差距,检索到更细微类别的跨媒体结果,因此细粒度跨媒体检索也可以称为跨媒体子类别检索。然而,细粒度跨媒体检索存在着以下两大挑战:(1)只在类别标签的弱监督作用下很难学习到细粒度子类别之间细微的差异,大大影响了检索的准确率;(2)不同媒体数据间不一致的分布和特征表示形成的异质性差异(媒体鸿沟),使得难以直接对跨媒体数据的相似性进行比较。本文首先回顾了近几年国内外的研究现状,在介绍目前主流的几种细粒度技术和跨媒体检索算法的基础上,引入自注意力机制和实体标签来学习细粒度子类别之间的判别性差异,然后使用生成对抗网络的对抗机制缩小跨媒体数据之间的异质性差异。本文的主要贡献为:提出了一种基于自注意力机制和生成对抗网络的细粒度跨媒体检索算法。针对跨媒体数据间的异质性差异,本文使用了生成对抗网络框架来解决此问题。该框架由特征生成器G和媒体判别器D组成。由于自注意力机制能够定位细粒度子类别之间的判别性区域,从而对不同的子类别加以区分,所以本文采用两个基于自注意力机制的特征提取器组成G。经过G提取的四种媒体数据的特征输入进公共特征学习模块,在媒体判别器的辅助下缩小媒体鸿沟,学习一个公共特征空间,最后采用余弦距离进行相似性度量,从而实现细粒度跨媒体检索。在4个数据集上的实验结果表明了自注意力机制对于学习细粒度特征的有效性。提出了一种基于实体级公共特征空间的细粒度跨媒体检索算法。以往的跨媒体检索算法只是简单地利用类别标签的粗粒度语义,导致公共空间中特征的含义模糊,考虑到实体的可区分性、相关性和可扩展性,提出了实体级公共特征空间的概念。首先针对视频数据含有噪声帧的特点,提出基于特征空间聚类的噪声帧滤除算法来获取更纯净的视频数据,然后在媒体判别器和基于实体标签的约束下学习实体级公共特征表示,该公共特征空间将类别标签的粗粒度特征与实体的细粒度特征相结合,进而更好地学习细粒度子类别的差异。与8种跨媒体检索算法的对比实验表明所提算法的性能有所提高,尤其在与视频有关的检索任务中提高尤为明显。设计并实现了基于生成对抗网络的细粒度跨媒体检索系统,该系统包含5个主要模块:操作设置模块、数据预处理模块、检索结果显示模块、检索性能分析模块、检索结果保存模块,实现了“输入可视化-跨媒体检索-输出可视化-性能分析”的功能。
其他文献
正交异性钢桥面板广泛应用于大跨径桥梁的主梁,但是其受力状态复杂,在重载大交通和温度变化的综合影响下,许多钢桥铺装出现了开裂、坑槽等病害,严重影响了桥梁的正常工作。传统修补材料只能在干燥、无水的条件下应用,而在连续降水的雨季,现有的养护材料无法对铺装进行及时、有效的修复,雨水顺着铺装破坏处源源不断地渗入铺装内部,导致钢桥面锈蚀以及铺装失效等更加严重的问题。在此背景下,急需设计一种能在降雨天气下使用的
亚东从1894年开关通商到1906年之间是藏英(印)之间唯一的商埠,在藏英(印)贸易中具有重要地位。文章以亚东关档案为主要依据,考查了1895至1905年间亚东关大宗出口商品的构成、流向、供求、价格及其影响因素等,提出清末西藏对外贸易是当时条件下西藏特殊自然地理环境的产物,是当时西藏乃至中国大部分地区社会生产状况的反映,也是英国以武力强迫将西藏纳入英(印)资本主义经济体系的结果,是整个中国被迫卷入
雷达和通信作为无线电技术的重要应用,其发展速度远超想象。伴随着技术发展,对系统的集成度和功能多样化提出更高的要求,可高效利用无线电系统硬件设备和频谱资源的雷达通信一体化系统应运而生。首先,本文主要研究了基于正交线性调频分频复用(Orthogonal Chirp-Division Multiplexing,OCDM)信号的雷达通信一体化技术,详细介绍了其基本原理和系统方案,讨论并确定了OCDM一体化
裂缝是房屋建筑中的一种常见重要病害,房屋裂缝的检测对结构检测、危房鉴定和维护具有重要意义。论文借助深度学习和图像处理技术,研究了建筑裂缝图像的识别算法、识别结果优化方法和裂缝参数计算方法,实现了裂缝检测测量系统的搭建,可为房屋质检与评估提供大量参考数据。本文主要开展了以下研究:(1)将Mask R-CNN深度学习模型应用于建筑的裂缝识别,通过数据增强扩充数据集获得大量训练样本,获得了较传统图像处理
永磁同步电机效率高、结构简单、功率因数高、控制特性好,特别适合高速运行,已广泛应用于机械加工业、电动工具、飞轮储能、高速离心机、高速压缩机等领域。绕组交流损耗、定子铁心损耗以及转子涡流损耗的准确计算是高速永磁同步电机的关键问题,也是近年来电机学科研宄的热点。论文对高频电流引起的绕组集肤效应、邻近效应进行了深入研究,分析了逆变器谐波电流对高速永磁同步电机绕组交流损耗的影响,得出了电机绕组交流损耗随载
氮化硅陶瓷刀具由于其优良的机械、化学性能而在高速切削领域得到了广泛关注。但目前,氮化硅陶瓷刀具仍面临一些问题,如性能仍不够高、无法制备复杂刀具表面结构等,这限制了氮化硅陶瓷刀具的更广泛应用。本文基于放电等离子烧结技术,制备出高性能氮化硅陶瓷刀具材料,研究两步烧结对刀具材料的影响,在SPS技术下进行了异形车刀制备工艺研究,并进行了异形氮化硅基陶瓷刀具切削镍基高温合金试验。添加10wt%Ti(C,N)
阵列天线因其有着高增益、低副瓣等优势被广泛应用于雷达和无线通信等领域中。随着人们对大型阵列的深入研究,降低阵列制造难度和让阵列取得更好的方向图性能成为了学者们更加关注的点,因此学者们提出了基于子阵划分的阵列天线,它是指将阵列以子阵形式划分,通过对子阵进行馈电来产生目标方向图,这样可以有效地减少有源天线单元的个数、降低馈电网络的复杂度和阵列的制造成本。这种阵列天线可以对子阵的激励幅度和相位进行优化,
随着雷达、卫星通信技术的不断发展,大规模阵列天线的应用越来越广泛。大型阵列雷达的设计目标是缓解工程实现的压力、减少收/发组件的使用,子阵技术的运用可以有效解决这些问题。为了简化馈电网络、降低算法复杂度,本文对小型阵列天线的非规则子阵划分算法加以改进,并在此基础上对大规模阵列天线提出基于稀布阵的非规则子阵划分算法,有效降低工程成本及系统实现难度。本文的研究成果及创新点概括如下:首先第二章介绍了天线阵
波长移相技术通过改变激光器的输出波长实现移相,跟推动压电陶瓷堆(Push Piezoelectric Ceramic Stack,PZT)移相不同的是,波长移相无需推动参考器,有效弥补了硬件移相带来的误差,特别适合于大口径光学元件的检测。但对于波长调谐激光器,加载的电压、输出的激光光强以及波长之间都不可避免地存在着非线性关系,如果直接把PZT移相干涉中的算法用到波长移相中,会给测试结果带来误差。为