论文部分内容阅读
人脸图像的识别一直都是计算机视觉和图像识别等领域的重要构成,也是深度学习和大数据的最广泛应用。卷积神经网络作为一种与深度学习技术结合的带有前向反馈的新型神经网络方法。相较于传统的人脸识别算法中采用的人工设计的人脸特征提取算法,卷积神经网络因采用局部连接、权值共享等方法,当面对复杂环境下的人脸图像具有模糊、角度变化、光照变化等情况时,具有更好的鲁棒性和准确率。这使得卷积神经网络在图像识别领域获得了广泛的应用。本文根据卷积神经网络的结构设计了人脸识别的检测方法,在池化方法、过拟合问题以及人脸定位问题上,通过更新算法进行改进。本文研究的主要内容如下:首先,通过阅读国内外文献,了解了人脸检测及深度学习的研究现状,总结了人脸检测存在的问题,确定了本文的研究方向和研究内容。其次,论文对卷积神经网络的理论知识、深度学习框架和卷积神经网络的优化算法进行了总结与归纳。首先分别从卷积层、池化层、激活函数对卷积神经网络的组成进行了介绍,紧接着说明了卷积神经网络的训练方法,然后介绍了卷积神经网络的随机梯度下降算法,最后分析了 TensorFlow深度学习框架。然后,针对图像识别中传统池化方法单一、难以提取有效特征等缺点,为获得最佳池化效果对卷积神经网络的池化层提出一种改进方法。从最优搜索理论出发研究如何在受约束条件下使探测到的目标函数概率达到最大,在不同情况下分别求出各子元素池化结果应分配的概率,使池化时以最佳概率分配各子元素,从而使卷积效果更好。将最优搜索的池化方法与当前应用中常用的池化方法进行对比实验。同时针对卷积神经网络在深度学习过程中过拟合的问题,提出了权重衰减(Weight-decay)和Dropout等方法解决过拟合的问题。通过正则化的加入对权重值进行一定范围内的修正。同时采用在卷积神经网络结构中添加Dropout,使其在模型训练过程中随机关闭或忽略某些层的节点,并在迭代过程中,根据准确率调整学习率的大小,并进行比较试验。最后,针对复杂环境下,多目标人脸难以定位的问题,提出了一种基于GLMB(generalized labeled multi-Bernoulli)滤波算法的人脸定位改进,提高了人脸定位的准度和鲁棒性。实验结果表明,优化后的池化方法更易提取有效特征,并获得了更高的准确率。权重衰减(Weight-decay)和Dropout等方法能有效解决模型训练过程中出现的过拟合问题,减少了训练时间。基于GLMB滤波算法的人脸定位改进在各种复杂环境下可以准确定位多个人脸目标。