论文部分内容阅读
人脸识别技术是机器视觉和模式识别领域的研究热点之一,在国防、公安、海关、交通、金融、医疗等诸多领域具有广泛应用前景。人脸识别技术的核心是针对人面部的特征提取技术,但是长期以来,传统人为定义面部特征的方式无法解决人脸姿态、年龄、表情、遮盖等因素影响,使得人脸识别技术发展缓慢。近年来,随着人工智能的迅猛发展,其中深度学习技术可以较为高效地提取人脸面部的高层、抽象、本质特征,有效地解决了传统技术所面临的的诸多困难,使得人脸识别技术重新成为机器视觉和模式识别的主流研究方向。基于深度学习的人脸识别算法尚在发展阶段,其主要存在以下问题:1)如何从学习模型的深度和模块内部结构的角度设计出更高效的深度网络模型,提取出更高层、更抽象、更本质的人脸特征;2)深度学习模型的损失函数设计较为单一,而满足通用性的损失函数设计必然涉及到复杂的神经网络训练过程,不合理训练数据生成过程会导致神经网络模型的损失值很难降低,收敛速度很慢,得不到充分的训练;3)基于深度学习的人脸识别算法本质是迭代优化逼近的过程,需要大量数据的训练和验证,人脸数据集的缺乏,使得算法研究和性能分析都受到了较大限制。本文针对目前人脸识别的研究现状与存在的问题,试图提出一整套高效通用的识别算法,主要贡献包括:1)本文深入分析了融入残差网络思想和 NIN(Network In Network)思想的 Inception-ResNet网络在人脸识别用用的可行性,并对其全连接层参数进行设计和调整,使其能够提取出更高层的人脸面部特征;2)针对人脸特征类内和类间差异性,设计了一种基于中心损失、人脸验证损失、Softmax损失三者混合的损失函数,并对其应用于神经网络训练的性能进行了对比分析;3)针对基于三元组损失模型训练时出现的收敛缓慢问题,设计了一种在线三元组训练数据批量生成算法;4)针对不同数据集混合训练,设计了一种以模型参数预加载初始化、迭代训练方式,以充分地学习到不同数据集的数据分布,同时解决多数据集中存在的样本重叠标记问题,实现多数据集综合训练。最后,本文通过LFW公开数据集进行人脸验证的性能分析。实验结果表明:1)基于中心性损失、人脸验证损失、SoftMax损失的三者混合损失函数驱动训练的深度模型Inception-ResNet可达到99.45%的性能;2)基于三元组损失,使用了高效的批量三元组训练数据生成算法的深度模型Inception-ResNet达到了 99.41%的性能。最后,本文对已有工作成果进行了总结,认为基于本文提出的深度学习模型可以有效提升人脸识别效果和效率,基本达到了实际应用的性能需求,并对未来准备在算法在真实场景下运行和移动模型计算方面的改进进行了分析。