【摘 要】
:
随着互联网的高速发展和5G网络的逐渐普及,图像和视频信息逐渐取代文字成为最重要的信息载体,也随之诞生了以美图秀秀和剪映为代表的图像处理和视频剪辑APP,这些软件降低了Photo Shop、Premiere等高级图像和视频处理软件的使用门槛,使得人人皆可处理图像和视频。其中,图像和视频修复是这些处理软件中最重要的功能需求之一,在图像编辑和去除水印等方面有着极其重要和广泛的应用。但是,现有的修复技术在
论文部分内容阅读
随着互联网的高速发展和5G网络的逐渐普及,图像和视频信息逐渐取代文字成为最重要的信息载体,也随之诞生了以美图秀秀和剪映为代表的图像处理和视频剪辑APP,这些软件降低了Photo Shop、Premiere等高级图像和视频处理软件的使用门槛,使得人人皆可处理图像和视频。其中,图像和视频修复是这些处理软件中最重要的功能需求之一,在图像编辑和去除水印等方面有着极其重要和广泛的应用。但是,现有的修复技术在修复图像和视频时往往会带来模糊的修复效果,受损目标很难得到有效的还原。随着深度学习的兴起,基于卷积神经网络(Convolutional Neural Networks,CNN)和生成对抗网络(Generative Adversarial Networks,GAN)的图像和视频修复方法展现了非凡的修复能力,能够生成以假乱真的内容,具有重要的研究价值和应用前景。因此,本文着眼于基于深度学习的图像和视频修复方法的研究,提出了结构图引导的两阶段图像修复模型和基于Transformer的时空域视频修复模型。(1)提出了一种结构图引导的两阶段图像修复模型。为了更好地引导修复网络进行训练,我们验证了结构图作为先验信息在两阶段网络中发挥着重要的作用。基于此,整个模型分为两个子网络:结构生成网络和纹理生成网络。首先,为了使纹理和结构分离,我们采用了基于相对总变差(Relative Total Variation,RTV)的算法去除纹理,得到轮廓清晰的结构;接着,将得到的受损结构图和受损的灰度化图像一起输入结构生成网络,获得修复的结构图;然后,使用修复后的结构图经由纹理生成网络来引导受损图像的修复,得到完整的图像。我们使用了重建损失、对抗性损失、风格损失和感知损失在Places2、Celeb A以及Paris Street View3个主流数据集上对模型进行端到端的训练并测试,实验结果的主观质量评价和客观质量评价都显示出我们的模型具有良好的修复效果。与对照方法比较,我们的模型在三个数据集上的平均峰值信噪比(Peak Signalto Noise Ratio,PSNR)提升了0.16dB~3.04dB。同时,我们增加了消融实验研究,通过与去除结构生成网络的模型进行对比,进一步证明了两阶段网络和结构图引导对我们模型的重要性和有效性。(2)提出了一种基于Transformer的时空域视频修复模型。Transformer的注意力机制能够有效获取参考帧的相关信息,提升网络获取相似特征的能力,对受损内容的填充起到了很好的引导作用。基于此,整个模型分为四个部分:多帧编码器、残差模块、Transformer模块和多帧解码器。受损视频帧通过多帧编码器变成多维特征图;残差模块加深网络并进一步提取特征;Transformer获取参考帧的有效信息,通过注意力机制查询受损帧的相关特征;多帧解码器通过上采样将视频帧恢复成原始大小。其中,Transformer模块作为整个网络的核心,采用了8层4头的多尺度注意力模型,将特征图嵌入成查询向量、键向量和值向量,并根据“嵌入—匹配—关注”得到多尺度融合后的注意力结果。我们使用了重建损失、基于时域PatchGAN的对抗性损失、风格损失和感知损失在YouTube-VOS和DAVIS数据集上对网络进行训练和测试。其中,时域PatchGAN鉴别器提高了网络对视频帧在时空域上分布特征的感知性能。实验结果显示,相比之前的方法,我们的模型在主观质量评价和客观质量评价上都取得了更好的修复效果,在2个数据集上的平均PSNR提升了1.14dB~5.26dB。
其他文献
碳材料中掺入杂原子不仅可以提高电导率,而且可以提高润湿性,这有利于电解质与电极之间的接触。此外,活化是调节碳质材料孔隙结构的非常重要的手段,本文分别以生物质废料榴莲壳和间苯二酚为碳源,以(NH4)2HPO4为掺杂剂制备了氮氧磷共掺杂多孔碳材料。以生物质废料榴莲壳衍生的水热碳为前驱体,经过(NH4)2HPO4不同质量比掺杂高温800℃处理2小时,成功制备了氮氧磷共掺杂的活性碳。通过对材料比表面、红外
现有的异常用电检测方法存在未考虑电力用户的位置信息、模型参数选取困难的问题。据此,提出了一种基于线性判别分析(LDA)和密度峰值(DPeaks)聚类的双判据无监督异常用电检测模型。该模型遵循“特征构造-维度规约-聚类-异常检测”的流程,借助聚类算法将用电模式类别不同的用户分类后再检测,在维度规约模块使用线性判别分析将用户的台区号输入检测模型,提升了模型的检出率和精确率;在异常检测模块设置双判据检测
随着科学技术的发展,机器人在工业、服务业及娱乐业有了广泛应用,投篮机器人是机器人竞赛中的重要项目,涉及到机器人研究的许多热点问题。本文以投篮机器人为实验平台,主要研究了四个问题:投篮机器人的硬件平台搭建、机器人的自定位算法、目标球体识别算法以及目标球体跟踪算法。首先基于投篮机器人竞赛规则搭建了机器人硬件平台并对机器人底盘进行运动学分析。对投篮机器人进行功能模块划分,采用麦克纳姆轮四轮O-长方形结构
在文本分类、图像标注、生物信息学等领域,数据对象往往呈现出多语义性的特点,传统的单标签学习框架不再适用。多标签学习认为每个数据样本可以同时含有多个类别标签,因此可以用来处理多语义性数据。多标签数据通常具有较高的维数,大量冗余特征的存在不仅会增大多标签学习算法的计算开销,而且会影响分类器的性能。特征选择是对高维数据进行维数约简的有效手段。稀疏特征选择对回归模型的回归系数矩阵添加稀疏正则项,通过对该矩
目的:本研究以AMO理论模型为理论框架,旨在构建一套客观、简便、易行的中国本土化的精益医疗激励水平评价工具,并通过实证,检验该工具的信效度,分析医院精益医疗激励水平的影响因素,以期为提升医院精益管理水平提供参考和依据。方法:在第一阶段精益医疗激励水平评价指标构建中,采用文献分析法以及半结构式访谈法构建精益医疗激励水平评价指标池;采用德尔菲专家咨询法对精益医疗激励水平评价指标池的每一个指标进行重要性
目的:本课题旨在课题组前期研究的基础上,以标记有萤火虫荧光素酶基因的SW480-luc细胞,建立原位结直肠癌NCG小鼠模型,研究蟾灵膏对模型小鼠肝转移的作用机制,并以HIF-1α/SDF-1α通路调控Warburg效应为切入点,探讨蟾灵膏对HIF-1α/SDF-1α及相关因子CXCR4、Akt、AMPK和VEGF蛋白表达水平的影响,从而为蟾灵膏在治疗结直肠癌肝转移方面提供客观、科学依据。方法:采用
开展运动训练监控在足球队训练的过程中具有重要的地位,监控得出的数据可供教练员参考设置训练内容及训练目标,使训练更加具有目的性和科学性。本文以广州体育学院女子足球队8名队员为测试对象,利用GPEXE设备及配套的Polar心率带采集负荷监控数据,目的在于整理分析4对4+2守门员练习1(间歇时间恒定)、4对4+2守门员练习2(间歇时间递减)、四个小球门4对4练习1(间歇时间恒定)、四个小球门4对4练习2
目的:本研究的目的在于探索产后子宫复旧不良的中药用药特点及临床组方规律,总结治疗产后子宫复旧不良的核心方药,并探究该核心方药加减应用于中药热敷熨疗法在产后子宫复旧中的临床疗效。旨在探索疗效显著的可用于热敷熨疗法促进产后子宫复旧的中药方剂,为临床医家辨证防治产后子宫复旧不良提供临床经验,同时为临床科室开展中医药特色疗法提供新的选药思路和试验依据。方法:1.文献研究:通过文献检索搜集中国中医药数据库、
目的:肥厚型心肌病(hypertrophic cardiomyopathy,HCM)是一种心肌疾病,属于原发性心肌病中的一种,病因不是很明确,部分专家认为其属于遗传性心肌病,且多家族遗传病史。2014年调查分析了美国人、欧洲人及亚洲人群HCM患病情况,估算患者人数约分别为80万、大于100万、大于100余万。近几年,我国一些心脏病学研究中心估计,HCM患病人数在增加。HCM是猝死的原因之一,且多见