自然场景下基于卷积神经网络的人脸检测与人脸性别识别研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:huaweihbl999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸特征因其所包含的性别、表情、身份及年龄等大量信息,在公共安全、智能服务、人机交互等领域显得至关重要。基于人脸特征的人脸检测及人脸性别识别如今已是计算机视觉领域的研究重点,但因自然场景下的人脸图像会受到光照、姿态、表情、遮挡、尺寸等因素影响,从而影响人脸检测与人脸性别识别效果。本文在卷积神经网络理论框架下,就自然场景下的人脸检测与人脸性别识别问题开展研究,主要研究内容如下:(1)基于四级级联全卷积神经网络的人脸检测研究传统的人脸检测存在提取特征表征能力较差,以及特征与分类器匹配程度不高等问题。针对上述情况,本文设计了一种基于四级级联全卷积神经网络的人脸检测算法。基本思路是通过构建四级级联网络,采用级联分级训练来代替端到端训练,以避免只共享一个网络权值的局限,进而获得有区分性功能的深度网络,提高检测精度;另外每级网络均设计为全卷积结构,用于提升检测速率;采用自举法进行网络模型的优化训练;最后通过前三级网络逐步检测过滤,同时借助最后一级网络矫正输出来得到人脸检测结果。实验结果表明,本文算法对于自然场景下的多姿态、遮挡、不同肤色人脸等均具有良好的鲁棒性,同时检测速度达到单张86ms,在人脸公开测试集FDDB上的召回率达到90.62%。(2)基于深度残差网络的多尺度人脸检测研究目前不少卷积神经网络因其结构简单与检测模型单一,对于自然场景下存在尺寸较小、姿态变化较大、遮挡较严重的人脸图像,还是会有很多漏检情形。针对以上问题,本文提出了一种基于深度残差网络的多尺度人脸检测算法。基本思路是以18层深度残差网络结构作为基础网络,在基础网络的末端不同位置上设计了针对不同尺度人脸的检测模块,来增加模型对于人脸尺度问题的辨识能力;同时引入CReLU作为激活函数,在保证精度不变的同时提升检测速率。经对多组人脸数据集测试实验表明,此算法在FDDB数据集上的召回率达到95.52%,在Wider Face测试集上的平均检测精度可达到93.30%,可有效地检测到尺度变换及遮挡等复杂场景下的人脸图像,具有较高的检测精度与鲁棒性。(3)基于多层特征融合卷积神经网络的人脸性别识别研究目前对于人脸性别识别,一些传统性别识别算法与卷积神经网络算法的识别精度还不是很高。为了进一步提高人脸性别识别的准确率,本文提出了一种基于多层特征融合卷积神经网络的人脸性别识别算法。基本思路是以AlexNet网络结构为基础,把浅层Conv2卷积层输出的特征图,与深层Conv4与Conv5卷积层输出的特征图经两倍上采样后相融合,利用多个卷积层的特征来提高网络模型的表征能力;另外引入具有可调目标监督机制的大边界交叉熵函数当作网络的损失函数,来增强对深层卷积网络学习的引导,使得同种性别间的类内间距更小,不同性别间的类间间距更大,进一步提高性别识别精度;经六组标准人脸数据集的测试结果表明,本文算法的识别准确率要高于其它传统的卷积网络算法。
其他文献
众筹作为一种随着互联网金融发展出现的新兴的筹资和电子商务模式,已经得到了越来越多的认可。众筹对于解决中小企业融资难、农业扶贫等问题具有积极的作用。由于众筹与传统的电子商务模式不同,大部分商品只有在众筹成功后才会进行产品的生产,因此众筹的投资者面对更大的信息不对称性和不确定性。故众筹中的项目信息对于投资者的决策起着很大的参考作用。现阶段的研究也围绕项目信息对于众筹是否成功的影响、融资绩效的影响等方面
板鸭是用盐腌后风干而制成的腌腊肉制品,传统板鸭是在秋冬季北风起时开始生产,利用自然条件来风干成熟。板鸭属于传统的高盐低水分的腌腊肉制品,板鸭盐分含量很高。长期食用
随着汽车保有量的增加,自行驾驶出行产生的换道行为越来越多。由换道行为导致的危险程度也随之增加。但随着传感技术的应用,使得减少换道过程中由于驾驶员判断失误导致的交通事故成为可能。通过传感器检测相应参数,通过车载装置及时协助驾驶员及时调整车辆状态,提高换道安全性和换道效率。本文首先通过选取轴身转向角、转向轮与车道线的距离、纵向加速度、横向加速度、横向速度、纵向速度等车辆显性运动参数,构建了基于PCA-
朱鹮(Nipponia nippon)为中国Ⅰ级保护鸟类,是世界范围内的濒危物种,当前主要以人工圈养种群的形式存在于中国、日本及韩国的部分地区。尽管朱鹮总数目不断增加,但仍存在种群分布零散、人工育种受精率低和雏鸟存活率低等因素,限制了朱鹮的重引入工作。因此,亟需从分子层面对朱鹮的免疫及繁殖做进一步的研究,以更好地指导朱鹮的人工圈养工作。β防御素是重要的免疫效应分子,在生物体抗菌及适应环境的过程中发
目的:通过使用荟萃分析的方法比较神经内镜下第三脑室底造瘘术(ETV)和脑室腹腔分流术(VPS)治疗正常压力性脑积水(NPH)的安全性和有效性,为NPH的外科治疗策略选择提供科学依据,指导临床实践。方法:通过检索:中国生物医学文献数据库、中国期刊全文数据库、万方数据库;美国的Pubmed数据库、欧洲的Embase数据库、英国的Cochrane图书馆临床试验中心数据库,同时人工检索灰色文献(如内部报告
作为一种新兴水果,火龙果(Hylocereus)果形优美奇特,色泽诱人,果实富含甜菜素、糖、酸、蛋白质及微量元素,深受消费者喜爱。但火龙果作为热带、亚热带水果,采后果实呼吸及代谢
全球价值链分工深化背景下,传统贸易统计体系已经不能适应以跨国公司为主体的公司内贸易现实,从而引起贸易“统计幻象”,扭曲一国的贸易差额,引发一系列的国际影响。所以,真实反映一国出口规模和贸易差额尤为重要,而基于所有权的统计框架可以厘清一国对外进出口贸易中的本国成分和外国成分,还原各国在贸易中真实的贸易差额。本文首先结合全球价值链分工深化的背景,从理论和实证两个角度证明了跨国公司的直接投资对国际贸易差
嗜酸性粒细胞胃肠炎(Eosinophilic Gastroenteritis,EG)是一种以外周血嗜酸性粒细胞(Eosinophil,EOS)增多为特征的胃肠道疾病。其主要诊断依据为消化道黏膜标本病理切片图像中嗜酸性粒细胞的数目是否超标。对EG诊断的传统方法是病理医生在光学显微镜下对消化道黏膜活检标本病理切片进行观察并对EOS细胞计数。病理医生人工计数是一项高重复性工作,且高度依赖医生的经验。本研
目的:检测不同中医体质的乙型肝炎e抗原(hepatitis B e antigen,HBeAg)阳性慢性乙型肝炎(chronic hepatitis B,CHB)患者辅助性T细胞17(T helper cell 17,Th17)/调节性T细胞(regulatory T cells,Treg)相关细胞因子白介素-17(interleukin-17,IL-17)和转化生长因子-β1(transform
运动目标检测是智能分析的第一步,实际应用中除了行人和车辆等一些常见的运动目标外,还有一些运动小目标需要检测。此外信息的采集会受天气的影响,随着大雾天气的增多,大雾天