论文部分内容阅读
人脸检测作为智能人机交互技术中的一个重要组成部分,是当前模式识别、人工智能、计算机视觉等领域的研究热点,近年来受到研究者的广泛关注。多姿态变化是人脸检测中一个突出的难题,其将非线性因素引入到人脸检测中,增加了检测的难度,降低了检测系统的性能。因此,本文通过学习一种深层非线性网络结构实现复杂函数逼近,自动地提取人脸的本质特征,使得特征表达不依赖人工选择,提高了整个系统的速度。此外,本文利用金字塔型的检测器细腻地划分了人脸姿态变化范围,有效地降低了检测过程中人脸的漏检数量。本文的主要工作如下:1.针对传统深度信念网络模型在构建神经元输出时的梯度消失问题,本文提出一种使用PRe LU函数改善的深度信念网络模型,在不增加计算量和过拟合风险较低的情况下,缓解了梯度消失的问题,加速了网络的收敛速度,改善了深度信念网络在参数训练过程中的效率。仿真实验从收敛性和分类误差百分比这两个角度出发,分析了本文改进的深度信念网络模型与传统使用sigmoid/Re LU进行激活的深度信念网络模型在性能上的差异。实验结果表明,使用PRe LU函数优化的深度信念网络在性能上表现比其他深度信念网络模型好。2.为了改善人脸检测系统受姿态变化、遮挡等因素造成的漏检、误检等问题,本文提出了一种融合上述深度信念网络和Float Boost算法的方法。该方法首先利用深度学习模型DBNs,根据人脸各部分之间的相关性进行人脸特征的提取,然后使用Float Boost算法学习不同姿态范围的检测器,将这些检测器由粗到细、由简单到复杂组成一种金字塔结构的检测器,将深度模型训练得到的特征作为弱分类器输入到该金字塔结构中,进行人脸/非人脸的分类。为了验证该方法的有效性,进行三组实验分析了本文方法以及其对比方法在不同召回率和误检率下的准确率。对比方法包括传统使用softmax算法进行分类的深度信念网络、当前性能较好的基于级联的方法、基于DPM的方法以及基于深度卷积神经网络的方法。实验结果表明,本文方法能够较好地检测出不同姿态范围的人脸,同时由于人脸特征的相关性,本文方法对部分遮挡的人脸也可以准确地检测。与上面这些比较优秀的人脸检测方法相比,本文方法受非限制环境的影响较小,可以获得与它们相似甚至更好的检测结果,具有较好的鲁棒性。