基于深度学习的人脸识别算法研究

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户:zwj10191021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别技术是机器视觉和模式识别领域的研究热点之一,在国防、公安、海关、交通、金融、医疗等诸多领域具有广泛应用前景。人脸识别技术的核心是针对人面部的特征提取技术,但是长期以来,传统人为定义面部特征的方式无法解决人脸姿态、年龄、表情、遮盖等因素影响,使得人脸识别技术发展缓慢。近年来,随着人工智能的迅猛发展,其中深度学习技术可以较为高效地提取人脸面部的高层、抽象、本质特征,有效地解决了传统技术所面临的的诸多困难,使得人脸识别技术重新成为机器视觉和模式识别的主流研究方向。基于深度学习的人脸识别算法尚在发展阶段,其主要存在以下问题:1)如何从学习模型的深度和模块内部结构的角度设计出更高效的深度网络模型,提取出更高层、更抽象、更本质的人脸特征;2)深度学习模型的损失函数设计较为单一,而满足通用性的损失函数设计必然涉及到复杂的神经网络训练过程,不合理训练数据生成过程会导致神经网络模型的损失值很难降低,收敛速度很慢,得不到充分的训练;3)基于深度学习的人脸识别算法本质是迭代优化逼近的过程,需要大量数据的训练和验证,人脸数据集的缺乏,使得算法研究和性能分析都受到了较大限制。本文针对目前人脸识别的研究现状与存在的问题,试图提出一整套高效通用的识别算法,主要贡献包括:1)本文深入分析了融入残差网络思想和 NIN(Network In Network)思想的 Inception-ResNet网络在人脸识别用用的可行性,并对其全连接层参数进行设计和调整,使其能够提取出更高层的人脸面部特征;2)针对人脸特征类内和类间差异性,设计了一种基于中心损失、人脸验证损失、Softmax损失三者混合的损失函数,并对其应用于神经网络训练的性能进行了对比分析;3)针对基于三元组损失模型训练时出现的收敛缓慢问题,设计了一种在线三元组训练数据批量生成算法;4)针对不同数据集混合训练,设计了一种以模型参数预加载初始化、迭代训练方式,以充分地学习到不同数据集的数据分布,同时解决多数据集中存在的样本重叠标记问题,实现多数据集综合训练。最后,本文通过LFW公开数据集进行人脸验证的性能分析。实验结果表明:1)基于中心性损失、人脸验证损失、SoftMax损失的三者混合损失函数驱动训练的深度模型Inception-ResNet可达到99.45%的性能;2)基于三元组损失,使用了高效的批量三元组训练数据生成算法的深度模型Inception-ResNet达到了 99.41%的性能。最后,本文对已有工作成果进行了总结,认为基于本文提出的深度学习模型可以有效提升人脸识别效果和效率,基本达到了实际应用的性能需求,并对未来准备在算法在真实场景下运行和移动模型计算方面的改进进行了分析。
其他文献
本文梳理了江西革命老区的扶贫历程和扶贫方式,指出以往"输血式"和"造血式"扶贫方式存在的问题,认为在当下精准扶贫战略中走文化扶贫之路是脱贫的有效方式。并提出文化扶贫的
为解决高固含量火炸药高粘态材料的高效混合问题,采用声共振混合方式对高粘态火炸药模拟物进行混合研究,采用扫描电子显微镜(SEM)和光学显微镜(OM)测试了混合均匀度。在40-80 Hz
<正>近期,南宁市出台了《南宁市快速公交(BRT)系统管理办法》(试行)。该办法对南宁市快速公交系统的运行、设施保护、服务及其管理做出了明确规定。为加强南宁市快速公交系统
在石油与天然气勘探开发过程中不可避免会对自然环境造成巨大的破坏,建立油气资源开发生态补偿制度是有效保护生态环境的重要途径。石油天然气在开采过程中,对土壤、植被、地
在国外智能视频监控领域的专利申请进行检索基础上,分析人脸识别技术在专利申请量趋势、技术原创国和目标国、主要申请人等方面的特点,对人脸识别技术的发展特点做出论述,以
期刊
将P2P技术引入到SIP协议的网络电话系统中,结合二者的优势,试图解决传统的基于C/S模式的网络电话所固有的扩展性差、单点失效和访问瓶颈等问题,提出了P2P—SIP网络电话系统的结构
目的:探讨外伤性脾破裂保脾治疗的临床效果。方法:回顾分析我院8年中外伤性脾破裂采取保脾治疗的31例的临床资料。其中粘合止血5例,缝合修补15例,脾动脉结扎+缝合修补3例,部分脾切
本文介绍一种闪蒸机清洗过程自适应控制方法。首先,确立一种新的闪蒸机清洗方案,即两段式蒸汽喷吹方案;其次,设定蒸汽流量稳定时间为清洗过程自适应阈值指标,在此基础上,提出
该文以杭州电子科技大学体育馆的设计为例.阐述了完善校园规划结构、丰富校园环境的设计努力,讨论了解决诸多建筑技术问题并追求建筑美学与情感的途径。