【摘 要】
:
在深度学习领域,自然图像、音频信号、文本符号等数据被认为服从特殊概率分布。深度学习模型中的生成模型通过建立满足上述数据分布的概率模型,可以直接生成与观测样本内容相似的数据样本,因此此类模型一直是学者重点关注的对象。与传统生成模型相比,生成对抗模型不依靠任何先验假设,且拥有操作简单的采样方式,所以拥有更广泛的应用场景。因此,本文围绕生成对抗网络原理与具体应用展开研究。 在本文中,我们首先介绍了生成
论文部分内容阅读
在深度学习领域,自然图像、音频信号、文本符号等数据被认为服从特殊概率分布。深度学习模型中的生成模型通过建立满足上述数据分布的概率模型,可以直接生成与观测样本内容相似的数据样本,因此此类模型一直是学者重点关注的对象。与传统生成模型相比,生成对抗模型不依靠任何先验假设,且拥有操作简单的采样方式,所以拥有更广泛的应用场景。因此,本文围绕生成对抗网络原理与具体应用展开研究。
在本文中,我们首先介绍了生成对抗网络在图像内容增强、特征学习等领域的相关应用,然后针对生成对抗模型拟合真实数据分布的能力进行了详细的理论证明。最后,我们结合生成对抗模型,以特征学习领域中的拷贝检测与内容增强领域中的图像去雾为具体应用场景进行研究。
在图像拷贝检测任务中,本文构建了互为竞争关系的拷贝网络和哈希网络,通过引入对抗样本对,使上述两个网络不断对抗学习,促使哈希网络生成鲁棒性和鉴别性良好的图像特征。另一方面,本算法再次沿用生成对抗的思想,通过引入鉴别网络,对服从二项分布的真实数据和哈希网络的输出特征进行区分,引导哈希网络产生服从二项分布的图像特征,从而利用该图像特征提升拷贝检测的效率。
针对图像去雾算法,我们利用属性交换和属性分离的思想,通过从有雾图像中分离与雾相关的图像特征,完成图像去雾过程,并将抽取后的与雾相关的特征应用在图像加雾中。之后我们使用生成对抗的思想,通过使用鉴别网络对真实和生成的有雾图像、真实和生成的去雾图像作出判断,从而直接和间接地提升了去雾网络的性能。与经典去雾算法相比,本算法得到了视觉质量更加优异的去雾图像。
综上所述,本论文利用生成对抗模型完成了图像特征学习与内容增强的相关工作,为图像拷贝检测与图像去雾提供了新的解决方案。
其他文献
视频中的异常行为分析在交通监控、社会安防等领域有着广泛的应用,近年来已经成为计算机视觉研究的热点之一。本文针对视频中运动目标的轨迹信息提取和异常行为分析开展研究。运动物体的轨迹能够提供目标运动行为模式的宏观信息,而且与视频数据相比,轨迹信息易于储存、传输和分析,尤其适于交通场景下的长时间车辆监控。因此,本文以运动目标的轨迹作为行为的主要表征,研究异常行为分析的几个关键技术问题。一方面,研究用于视频
合成孔径雷达(Synthetic Aperture Radar,SAR)遥感与光学遥感相比,能够全天时、全天候、全地域进行实时数据采集,成像效果不受时间、气候和地域的影响。同时,合成孔径雷达成像分辨率与目标距离无关,在国防和民生方面具有非常重要的作用。由于其相干成像机制,合成孔径雷达图像中不可避免地会产生斑点噪声。斑点噪声是一种依赖于观测信号的颗粒状噪声,是相干成像系统中固有的噪声,相干斑的存在降
随着对海洋资源环境越来越多地开发利用,人们对海洋信息的采集要求不断提高,测量船作为信息采集设备的主要载体,对其航行控制,尤其是航迹控制,也提出了更高的要求。自动舵是实现航迹保持的主要设备,在测量船航行过程中,由于受到海上环境的干扰,会偏离预先设定的航线,此时需要自动舵装置控制船舶改变航向,使船回到规定的航线上,这样测得的数据才是我们预期中想要得到的数据。 近年来,人工智能技术发展迅速,应用也越发
低频微振动在我们日常生活中、工业领域中随处可见,如生命体征监测、桥梁楼宇质检、地震监测等。但是,对低频微震动的测量参数获取比较复杂和困难,其被测对象形貌复杂,振动频率通常在几个赫兹范围,振动幅度在毫米,甚至亚毫米级别。因此,传统的接触式测量方法具有一定的局限性。为了实现快速、精确的全场振动测量,非接触式光学图像测量方法提供了一种合适的解决方案。非接触式光学图像测量方法是通过振动信号对图像特征点的像
雾霾天气下拍摄的图像存在细节模糊、色彩偏移、低对比度等问题,严重影响户外视觉系统发挥效用。因此,雾霾图像清晰化研究具有重要的理论意义和应用价值。论文根据雾天图像成像特点,针对目前基于统计先验和基于学习方法去雾后图像易出现颜色失真、细节模糊及噪声放大等问题,提出了新的见解和方法。论文主要工作如下: 首先,为了避免图像去雾后细节模糊和噪声放大,将图像分解为结构层和纹理层,并只对其结构层进行去雾。基于
随着计算机的普及和数字图像处理技术的进步,计算机视觉技术得到了飞速的发展,利用深度学习的方法进行目标检测与识别,较传统的目标检测与识别方法,实现了自动化、智能化和高效化,且具有更高的检测识别精度。 红外图像与可见光图像相比较而言,其抗干扰能力更强,红外图像的目标检测变得越来越重要,尤其是在军事领域和恶劣环境下。然而现如今,目标检测技术主要集中在可见光图像领域,可见光图像与红外图像成像原理不同,因
目标检测是计算机视觉中最具挑战性的问题之一,其目的是检测图像中特定目标的位置,已广泛用于人脸识别、自动驾驶、行人检测、视频监控等领域。基于深度学习的方法由于其无需进行人工特征设计、具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流。针对特征金字塔网络易丢失细节和检测速度慢等问题,本文提出了高效轻量化特征金字塔网络及其目标检测算法。主要工作如下: 与基于图像金字塔的目标检测方法相比
语音是人类传递信息最直接的方式。近年来,发声器官器质性或神经性的病变使得嗓音疾病发病率越来越高,嗓音含混不清会影响人们的沟通效率,采用非侵入式的信号处理方式对病理嗓音进行修复,能提高受损语音的可懂度,提高人们的沟通效率。此外,病理嗓音修复在语音识别、机器导航、语音增强、语音通信系统、军事刑侦和隐蔽监听等领域都有着很广泛的应用前景。本文以提高病理嗓音可懂度为目标,设计实现了一套完整的病理嗓音修复系统
随着计算机技术和计算机视觉的迅速发展,人脸表情识别算法在人机交互环节中充当着重要角色,有着非常广阔的应用前景。人脸表情识别算法可以统计学生在课堂上的听课状态、记录司机在驾驶过程中的疲劳程度、捕获危险分子在公共场所的异常表情避免不必要的事故等等。提高人脸表情识别算法的准确率是人脸表情识别领域的重要任务。 选择合适的网络结构和损失函数对于提高基于卷积神经网络的人脸表情识别算法的准确率至关重要。人脸表
复杂背景下的目标检测是计算机视觉领域的核心问题之一,其主要任务是识别和定位图像中的目标。本文针对复杂背景下的目标检测提出结合显著性和模板匹配的算法。首先对图像做显著性预处理,然后在显著性区域内实现目标检测,最后对基于显著性和模板匹配的目标检测算法做实验分析。 在显著性预处理过程中,首先提取图像的超像素特征向量,通过随机森林分类得到包含前景、背景和未知区域的初始显著性三元图,在三元图中完成显著性检