论文部分内容阅读
作为生物识别技术的重要应用,人脸检测、对齐和识别已经受到科学研究的广泛重视。人脸检测和对齐是人脸识别中的关键预处理步骤,对识别准确率有着重大影响,因此研究人脸检测和人脸对齐算法有着重要的意义。然而,现有的人脸检测数据集缺少装饰和遮挡的图像,并且现有人脸检测算法在面对这些困难的检测任务时存在挑战。现有的人脸对齐算法在对齐低分辨率图像时误差较大,现有的图像超分辨率重建算法重建的人脸图像存在伪影与噪声并缺少高频细节。针对以上问题,本文提出基于 MTCNN(Multi-task Cascaded Convolutional Neural Networks)优化的人脸检测算法,以及联合超分辨率与人脸对齐算法,主要工作有:(1)多任务学习的人脸检测算法MTCNN的优化针对MTCNN在检测带有遮挡和装饰的人脸图像时误检率高的问题,本文提出了三种优化方法。一、使用正交矩阵初始化卷积层权重,提升模型性能。二、引入角度余量到Softmax损失函数,增加学习的难度,提高模型鲁棒性。三、优化网络结构,增加全连接层和节点数以提高模型性能。本文提出的优化方法在FDDB(Face Detection Data Set and Benchmark)数据集上比原算法的检测准确率提高了 0.3%,此外,本文也提出包含遮挡和装饰人脸图像的社交网络人脸数据集SNFA(Social Network Faces),所提议的优化方法在SNFA数据集上的误检率比MTCNN低4%。(2)超分辨率与人脸对齐算法优化和人脸对齐应用针对人脸对齐算法DAN(Deep Alignment Networ)在低分辨率图像上的人脸对齐性能差的问题和超分辨率重建算法SRGAN(Super-Resolution Generative Adversarial Network)对于小尺寸人脸图像的重建图像会有伪影和噪声的问题,本文提出联合训练人脸超分辨率重建和人脸对齐的FSR-SEAN-GAN方法。FSR-SEAN-GAN包含基于特征点热图与生成对抗网络的人脸超分辨率重建网络,和利用压缩激励模块的人脸对齐网络。FSR-SEAN-GAN提升了人脸超分辨率效果,对于24×24的低分辨率图像,所提议方法的PSNR(Peak Signal to Noise Ratio)相比于图像超分辨率方法 SRGAN(Super-Resolution Generative Adversarial Network)和ESRGAN(Enhanced SRGAN),在300W数据集上有10%以上的提高,同时所提议方法在低分辨率图像上的人脸对齐性能有3%以上的提升。之后本文基于深度可分离结构设计了DSAN人脸对齐网络,相比于DAN模型,卷积层参数减少60%,模型大小缩小50%。最后本文基于DAN的图像转换层,在LFW数据集上进行基于人脸对齐的人脸识别应用;基于DAN预测的特征点坐标,进行头部姿态估计应用。