论文部分内容阅读
人脸识别是计算机视觉领域的研究热点,可以被广泛应用于视频监控、门禁系统等场景,具有十分重要的实用价值。在实际应用中,人脸识别仍然面临着较多的挑战,例如在较差的光照、姿态和黑框眼镜等情况下人脸识别算法的鲁棒性。在一些实用场景如手机应用等,对计算速度和参数量也有更高的要求。本文主要对人脸识别实际应用中存在的一些问题进行了研究,主要工作总结如下: (1)研究了人脸识别系统中一些十分实用的人脸图像预处理技术,包括眼镜去除,人脸对齐等。针对眼镜遮挡问题,本文提出了基于数据驱动以及基于全卷积网络进行眼镜去除的两种方法。两者都在一定程度上提升了人脸识别算法对于眼镜的鲁棒性,尤其是后者。此外,本文还改进了传统的人脸对齐算法。通过在人脸识别网络中加入空间变换网络,端到端地实现了人脸对齐和人脸识别的过程,既简化了整个人脸识别流程,也节省了网络的计算量和参数量。 (2)卷积神经网络的网络结构直接影响了网络的性能。本文在固定时间复杂度和参数量的情况下,研究了多种影响网络性能的因素,包括卷积核尺度、网络深度、网络节点连接方式等。通过逐项调优,相比于基准模型获得了明显的性能提升。 (3)卷积神经网络中的损失函数也是影响网络性能的重要因素。本文主要研究了两种损失函数。第一种是有利于学习低维且判别能力较强的特征的Fisher损失函数,其思想来源于线性判别分析算法。实验证明,联合Softmax和Fisher损失函数的方法比仅用Softmax损失函数效果更好。此外,Fisher损失函数学到的低维特征与Softmax损失函数学到的高维特征在人脸识别的性能上也是可比的,这种低维且判别能力较强的特征更适合于大规模检索或者移动端的一些应用,因此具有十分重要的实用价值。本文研究的第二种损失函数是Pairwise类型的Contrastive损失函数,该类损失函数在训练过程中直接优化两个样本之间的距离,其优化方式十分切合人证等人脸验证问题。基于Constrastive损失函数,本文采用了两种采样策略,并通过实验证明了两种采样策略的有效性,两者都比仅使用Softmax损失函数效果更好。