论文部分内容阅读
生成对抗网络(GAN)由Goodfellow带领的研究团队于2014年首次正式提出,它包含生成器和判别器这一对相互竞争的模型,通过对二者采用独特的对抗训练机制,使得生成器无需先验假设便可学习到真实样本的潜在分布。GAN自诞生以来,深受学界与工业界的高度关注。一方面,针对GAN存在训练困难、模式崩溃等问题,有许多改进模型陆续问世。另一方面,鉴于GAN的框架非常灵活,有很多研究将它应用于不同的领域。本文立足于这两方面,对GAN及其系列改进模型进行深入的理论与实验研究,另外,将GAN的应用领域拓展至平面设计。本文所做的详细研究工作概括如下:首先,通过全面梳理GAN的相关研究,选取了五种改进原有网络结构或损失函数的典型模型,分别是DCGAN,WGAN,WGAN-GP,LSGAN和CGAN。本文以GAN和这五种改进模型为重点研究内容,先从理论上对它们进行了细致的分析。接着,为对比六种模型的生成能力,从网上搜集了104383张动漫人物图像,结合该数据集特点和DCGAN的网络结构,对WGAN,WGAN-GP,LSGAN和CGAN的网络结构进行了适当的改进,继而使用这六种模型对该数据集进行图像合成实验。实验结果显示WGAN,WGAN-GP,LSGAN,CGAN生成图像的效果相近,而且它们总体优于GAN和DCGAN,另外,DCGAN生成图像的效果总体优于GAN。该实验结果说明了WGAN,WGAN-GP,LSGAN对应损失函数的优越性以及DCGAN,CGAN对应网络结构的有效性。鉴于生成对抗网络存在严重的训练问题,本文通过实验发现选择Adam优化算法是较为稳妥的方式,另外,使用标签平滑法能改善训练不稳定的问题。其次,为进一步延伸GAN的应用领域,本文使用Layout GAN来研究平面设计中的布局生成问题。具体而言,先从理论上分析了Layout GAN的生成器、基于关系判别器以及线框渲染判别器,接着设计了符合Layout GAN思想的网络结构,然后对MINST数据集进行实验,验证了该网络结构的有效性,并且实验结果表明线框渲染判别器要优于基于关系判别器,继而只使用带有线框渲染判别器的Layout GAN对SUNCG数据集进行实验,最终实现了平面布局的自动生成。