基于深度学习的人脸检测算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:js_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,基于卷积神经网络的人脸检测算法已经取得巨大的成功。然而由于人脸在尺度、姿势、表情、遮挡、模糊等方面具有高度的变化性,人脸检测仍然是一个具有挑战性的问题。为了提升人脸检测任务的检测效果,本文提出了混合特征金字塔。混合特征金字塔使用不同的方式产生高层语义信息和用于检测的特征图。与FPN(Feature Pyramid Network)相比,混合特征金字塔加工特征的方式更为细致。设计了一个新的人脸检测算法,取名为HPCNet。HPCNet将混合膨胀卷积、混合特征金字塔和上下文信息提取器引入到卷积网络。混合膨胀卷积可以快速增大感受野,获取高分辨率的特征图。上下文信息有利于提升分类准确率。运用改进后的OHEM(Online Hard Example Mining)训练HPCNet。改进后的OHEM可以更为均衡地选取正负样本。本文在WIDER FACE验证集上测试HPCNet,在Easy、Medium、Hard子集上的平均准确率(AP)分别为0.933、0.924、0.848。人脸检测任务不仅要求检测效果足够好,还要求推理时间足够短,检测速度足够快,这是人脸检测面临的又一个重要挑战。为了提升人脸检测任务的检测速度,本文设计了双信息流结构(TIFB),并基于TIFB组建了特征图快速缩减模块(FMFSM)。TIFB可以获取更鲁棒的特征图,有利于加强特征图的传递、再利用和梯度的反向传播。FMFSM减缓特征图通道数增长,快速缩减特征图尺寸,这极大地减少了网络的计算量。设计了视网膜感受野结构(RRFB),并基于RRFB组建了变尺度人脸检测模块(VSFDM)。RRFB模仿人类的视觉系统,可以获取含有丰富尺度信息的鲁棒的特征图,快速提升网络的计算效率。VSFDM在多个特征图上进行人脸检测,减轻了单个或复合特征图的负担。设计了一个新的人脸检测算法,取名LRNet。LRNet由FMFSM和VSFDM组成。LRNet计算量小,计算效率高。改进了Face Boxes的先验框策略。改进后的先验框策略不仅考虑不同尺度先验框的密度,还考虑特征代表区域的性质。本文在FDDB数据集上测试LRNet,当假正例(FP)为2000时,离散和连续分数下的真正例率(TPR)分别可达0.951和0.725。在NVIDIA 1080TI上,对于1024*1024分辨率的输入图片,LRNet检测速度可达112FPS(Frames Per Second)。
其他文献
对各方面工作提出议案和建议、批评、意见(以下简称建议),是宪法和法律赋予人大代表的一项重要职权,也是人民当家作主的重要形式。人大及其常委会既是国家权力机关,也是民意代
从认知语言学的框架理论来看,文学翻译的困难之一是读者认知框架的缺损问题。文学翻译者的一个重要任务就是要在读者头脑中构建新的认知框架,以弥补读者认知不足的缺憾。构建
<正>存款准备金制度起源于18世纪的英国,最初的主要功能是政府变相地向商业银行征收税收。历经美国1863年的《国民银行法》、1935年的《银行法》,准备金制度得到全球各国的普
目的探讨浸润性乳腺癌中IGF-1的表达及生物学意义。方法应用免疫组化EnVision法检测62例浸润性乳腺癌组织中IGF-1蛋白的表达水平。结果腋淋巴结转移者中IGF-1阳性率高于无腋
<正>在摆脱早期的私人货币竞争发行的时代,中央银行产生后,私人货币供给主要体现在非银行金融机构的信用创造能力上,这一问题在金融市场得到发展后重新得到了关注。如格利和
要作好建筑工程质量的控制,防水工程的质量控制是很重要的一个环节,本文着重描述防水工程质量管理从准备工作到正式施工时需要注意的控制措施。
俳优小说为“谐谑文学”文体之一,其渊源与谐谑文学各种文体都相关;俳优小说兴起的现实土壤,主要有汉魏晋之通脱、玄学和佛学三种风尚;俳优小说的品格有大俗大雅二重性,具有
近代中日教育关系中的社会教育,是研究中国教育现代化进程中一个应该关注的课题。在近代社会背景下,中日社会教育关系经历着教育交流与教育侵略两个密切交织的过程,呈现出模
目前,人类安全研究大多局限于20世纪50年代的传统主题,如援助机构、联合国发展和经济增长模式等。近年来,城市地区安全问题、发达国家人口、原住民族、商业利益集团、新全球
自由主义女性主义与社会主义女性主义都是最早产生于英国的两个理论流派。她们从妇女的视角出发 ,重新审视人类社会的政治理念和两性 ,探讨两性不平等的根源、两性之间的差异