论文部分内容阅读
近年来,随着深度学习理论和技术的快速发展,生成对抗网络理论一经提出就已经在越来越多的领域如计算机视觉、自然语言处理、计算机安全等领域得到快速应用和发展。其中,为了使用同一个神经网络生成不同种类的图像,人们提出了条件生成对抗网络。本文关注条件生成对抗网络在计算机视觉领域的一个应用,人脸表情编辑。人脸表情编辑这个任务的难点在于要对输入人脸图片进行高维语义理解,一方面要变换表情,另一方面要求变换后的图像要能够保留输入人脸的身份特征。传统上,人脸表情编辑这个课题一直被计算机图形学者们研究,近年来才出现基于深度学习的方法。此前的方法要么需要成对的训练数据,要么生成的图像分辨率很低,而且这些方法都只能生成指定表情下的单一图片。本文在调研大量文献的基础上,提出一种基于条件生成对抗网络的人脸动态表情生成算法。该算法具有如下特征: 1.本文针对已有人脸表情生成算法或者只能根据输入人脸生成指定表情下的唯一图片;或者即便可以生成动态人脸表情,但不能指定表情变化幅度的方向这个缺点,通过改变网络的输入和调整网络结构,可以指定方向的生成某个表情下的多帧图片。 2.本文针对目前人脸表情算法只能生成低分辨率图像这个现象,通过引入已有的渐变增长式生成对抗网络训练算法,将生成的图像分辨率由128×128提高到256×256。 3.本文针对已有基于神经网络的人脸动态表情生成算法不能很好的保留输入人脸的身份特征这一缺陷,通过分阶段学习和局部优化的方式调整网络,使得变换后的人脸与输入人脸保持相同身份特征。