非限制条件下的多姿态人脸检测算法研究

来源 :兰州理工大学 | 被引量 : 4次 | 上传用户:new4sophia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测作为智能人机交互技术中的一个重要组成部分,是当前模式识别、人工智能、计算机视觉等领域的研究热点,近年来受到研究者的广泛关注。多姿态变化是人脸检测中一个突出的难题,其将非线性因素引入到人脸检测中,增加了检测的难度,降低了检测系统的性能。因此,本文通过学习一种深层非线性网络结构实现复杂函数逼近,自动地提取人脸的本质特征,使得特征表达不依赖人工选择,提高了整个系统的速度。此外,本文利用金字塔型的检测器细腻地划分了人脸姿态变化范围,有效地降低了检测过程中人脸的漏检数量。本文的主要工作如下:1.针对传统深度信念网络模型在构建神经元输出时的梯度消失问题,本文提出一种使用PRe LU函数改善的深度信念网络模型,在不增加计算量和过拟合风险较低的情况下,缓解了梯度消失的问题,加速了网络的收敛速度,改善了深度信念网络在参数训练过程中的效率。仿真实验从收敛性和分类误差百分比这两个角度出发,分析了本文改进的深度信念网络模型与传统使用sigmoid/Re LU进行激活的深度信念网络模型在性能上的差异。实验结果表明,使用PRe LU函数优化的深度信念网络在性能上表现比其他深度信念网络模型好。2.为了改善人脸检测系统受姿态变化、遮挡等因素造成的漏检、误检等问题,本文提出了一种融合上述深度信念网络和Float Boost算法的方法。该方法首先利用深度学习模型DBNs,根据人脸各部分之间的相关性进行人脸特征的提取,然后使用Float Boost算法学习不同姿态范围的检测器,将这些检测器由粗到细、由简单到复杂组成一种金字塔结构的检测器,将深度模型训练得到的特征作为弱分类器输入到该金字塔结构中,进行人脸/非人脸的分类。为了验证该方法的有效性,进行三组实验分析了本文方法以及其对比方法在不同召回率和误检率下的准确率。对比方法包括传统使用softmax算法进行分类的深度信念网络、当前性能较好的基于级联的方法、基于DPM的方法以及基于深度卷积神经网络的方法。实验结果表明,本文方法能够较好地检测出不同姿态范围的人脸,同时由于人脸特征的相关性,本文方法对部分遮挡的人脸也可以准确地检测。与上面这些比较优秀的人脸检测方法相比,本文方法受非限制环境的影响较小,可以获得与它们相似甚至更好的检测结果,具有较好的鲁棒性。
其他文献
随着大规模数据存储技术、信息技术和网络技术的发展,越来越多的人正陷入数据泛滥、知识匮乏的困境中。为满足日益增长的信息需求,促使数据挖掘技术广泛地应用于各行各业。聚
近年来,运动捕获技术迅速发展并被广泛应用到教育、医疗、娱乐等领域。一些公司和科研机构相继开发了成熟运动捕获系统,这些系统能够满足绝大部分的运动捕获应用但普遍价格昂
随着计算机网络技术的迅猛发展,网络教学以其方便快捷、内容丰富等诸多优点,迅速成为倍受欢迎的教学手段。目前,我国各个高校都在收集、整合校内外的优秀教学资源,大力建设自己的
医学影像在病症诊断,科学研究,教学等方面发挥着举足轻重的作用。医学图像分割是医学图像处理中一项非常重要的工作,也是图像处理领域中研究的热点和难点,由于人体结构复杂性
随着物联网的不断发展,面向服务网络的需求日益突出,如何达到网络中信息获取的准确性、信息交互的实时性,已经成为研究的热点。普通的网络层、应用层信息融合并不能很好的满
社会计算作为一门新兴学科,是社会学与计算机科学的交叉领域。从宏观层面上看,社会计算使用计算技术来研究现实社会的诸多问题,从而促进人类的社会活动。过去的工作中,有关于Face
为解决目前工作流引擎产品存在的种类繁杂。兼容性能差等问题,探讨了工作流。工作流管理系统。工作流引擎的基本概念以及国内外研究现状,在深入分析相关理论。技术和方法的基
支持向量机是建立在统计学习理论基础上的一种新型机器学习方法,较好的解决了非线性、高维度、局部极小等问题,成功的应用于小样本、高维度数据的学习中。但是,当训练样本中含有
跨站脚本(XSS)攻击是目前Web应用程序最大的安全问题之一。最近研究人员提出的漏洞检测模型XSS-SAFE通过Java Script的特征注入和Java Script源码注入消毒程序完成自动化的XS
作为应用于自治系统之间交换域间路由信息的协议,边界网关协议BGP已被广泛地使用。但随着网络规模的快速扩大,网络拓扑结构越来越复杂,传统的协议实现方法已不能满足网络管理