跨姿态人脸识别方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wenty2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别是进行身份验证的一项关键技术,能够快速、便捷、高效地对目标人脸完成鉴权。过去十几年来,在深度学习的推动下,人脸识别技术实现了飞跃式的发展。尽管如此,人脸识别技术的发展仍然受到姿态、光照、遮挡等因素的制约,其中姿态变动的影响尤为显著。因此,相当多的科研人员投入跨姿态人脸识别研究之中,从网络结构设计、损失函数改进、训练数据利用方式等多角度进行探索。基于前人的工作并针对其缺陷,本文从以上多个角度出发,提出了三种跨姿态人脸识别的创新方法:1.针对网络结构设计,本文提出了一种基于渐进式特征变换网络的跨姿态人脸识别方法。一方面,姿态归一化是跨姿态人脸识别的一个重要方法,但目前相关研究集中于合成图像上的研究,基于特征变换的研究较少。另一方面,直接拟合从大姿态人脸到正脸的变换过程困难度与复杂度较高,容易陷入局部最优点。基于此,本文设计了一种轻量级的渐进式特征变换网络,分别用三个连续的模型拟合从侧脸到半侧脸、半侧脸到半正脸、半正脸到正脸的渐进式变换,以此降低姿态归一化的难度。最后,通过实验验证了该方法在多个数据集上能够有效地提升跨姿态人脸识别的准确率。2.针对损失函数改进,本文提出了一种基于注意力机制的成对损失函数。在进行跨姿态人脸识别时,模型对不同姿态下的人脸之间的潜在共同属性的挖掘很大程度影响着模型的识别准确率。而基于损失函数的方法大多认为人脸特征中不同区域是同等重要的,没有着重于其共同区域。基于此,本文创新性地提出一种基于注意力机制的成对损失函数,利用注意力机制约束网络着重关注于不同姿态人脸特征中的共同区域,减少对无关区域的注意力资源分配。最后,通过设计验证实验,验证了该方法的有效性。3.针对训练数据利用方式,本文提出了一种基于多任务学习与动态权重的跨姿态人脸识别方法。通过合成人脸数据作为数据增强的手段训练模型是跨姿态人脸识别的一个有效方法。但合成的人脸往往不够真实,直接利用其训练可能导致网络的优化方向发生偏离,难以达到最优点,甚至导致网络性能下降。基于此,本文提出了基于多任务学习与动态权重的方法,对合成的训练数据赋予动态权重进行多任务学习,一方面避免了合成数据中噪声、形变等因素的干扰,另一方面更加有效地学习对不同姿态数据的拟合。最后,通过多个数据集上的实验,验证了该方法能一致性地提升跨姿态人脸识别的性能。
其他文献
近些年来,移动机器人技术是科学研究发展最快的领域之一。移动机器人根据其不同的能力可以在许多领域替代人类,其主要的功能包括巡逻、监视、紧急救援行动、石化应用、工业自动化、行星探测、极端环境中的运输、医疗等,以及许多其他工业和非工业应用。移动机器人导航是当前移动机器人应用领域中的重要研究分支,主要可以分为自主导航、机械遥控导航、共享-自动导航。传统自主导航技术中缺乏灵活性,而且无法实时与使用者进行交互
史料实证素养作为历史学科核心素养的重要部分,更是其他素养实现的必要途径。为此,以史料实证为出发点探究其在高中历史课堂中的落实,不仅能够达到课程立德树人的根本任务,同时运用有效史料建构教学过程,促进学生理解和领悟历史知识,发展历史思维,形成实证意识。本文基于“两宋的政治和军事”一课,对史料实证素养的落实做出分析,以促进学生史料实证素养的培养和发展。
股票市场作为金融市场的重要组成部分之一,几十年来一直备受关注。对股票指数涨跌趋势的预测和交易模型的收益分析一直是研究者和投资者关注的焦点。对于股票指数涨跌趋势的预测,本文通过构建一个基于遗传算法优化的卷积神经网络和长短时记忆的混合模型来展开研究。首先改进了用作模型输入的三维张量,然后使用卷积神经网络进行特征提取,再利用长短时记忆网络对提取出的特征向量进行分类预测。最后,使用遗传算法对卷积神经网络和
人民生活水平的提高带来了汽车需求的提升,随之而来的是频发的交通事故,研发安全的汽车辅助驾驶系统成为了当务之急。而车道线检测是汽车辅助驾驶的重要组成部分,车道线信息在汽车行驶过程中是车辆有无偏离车道的重要参考,对汽车安全行驶有重要意义。为此,研究人员在车道线检测问题上展开了深入研究。传统的车道线检测算法依靠人工设计特征,鲁棒性较差,且无法应对复杂的城市街道背景。随着深度学习技术的崛起,以卷积神经网络
深度学习技术的出现降低了数字媒体编辑的技术门槛,在影视制作、生活娱乐等领域具有良好的应用价值,同时也存在潜在的安全隐患。近年来,Deepfake换脸技术受到广泛社会关注,由其制造的恶意虚假视频的传播对社会舆论和身份信息安全造成了极大的威胁和冲击。由于Deepfake换脸视频带来的安全问题,换脸视频篡改检测已逐渐成为研究热点。目前的换脸视频篡改检测算法在训练数据库上可以达到良好的库内检测性能,但在跨
水凝胶是一种具有三维网络结构的高分子聚合物材料,能够容纳大量的水而仍然保持不溶性,并且具有良好的亲水性、渗透性、生物相容性和低摩擦系数等特性。因而水凝胶在生物医学等领域得到广泛利用,如药物输送、组织工程、隐形眼镜、伤口愈合、生物传感器膜、微流体阀、流体吸收剂等。然而,目前大多数水凝胶的力学性能和结构稳定性较差,而很多力学性能较好的水凝胶生物相容性较差,使其应用受到了很大程度的限制。因此,解决上述水
随着电力负荷的日益增长以及城市负荷密度的快速发展,20kV电压等级配电网将成为我国中压配电网发展的必然趋势。相比于10kV的城市配电网,20kV中压配电系统通常以全电缆送电为主,更大的供电半径导致系统对地电容电流也会更大,传统的阶段式零序过电流保护方案对于单相高阻接地故障的情况将失效。同时,不同中性点接地方式下的单相接地故障所表现的故障特征也不尽相同,尤其是对于零序分量而言。而现有对于中压配电网的
森林火灾以及生物质的焚烧使富氮生物炭在自然环境,尤其在土壤和沉积物中不断蓄积。富氮生物炭孔隙发达,表面电子活度强,可吸附、固定毒害污染物,并产生相互作用。富氮生物炭中因氮取代碳网结构中碳的位置差异,存在三种不同的构型(吡咯氮、吡啶氮和石墨氮),这些构型氮使富氮生物炭在电子转移或电子对共用等方面表现出显著差异,进而可能影响富氮生物炭与重金属之间的交互作用。为了明确环境中大量存在的富氮生物炭中不同构型
对于新创农村网络零售企业而言,资源不足是制约其持续发展的重要因素。而构建科学的创业网络,有助于为新创农村网络零售企业发展提供丰富的资源土壤,这能够促进企业绩效的提升。基于此,本文通过调研处于电商产业园的农村新创网络零售企业,并收集了相关数据,采用AMOS软件检验变量间的直接作用关系,采用SPSS软件检验带有调节效应的变量关系,旨在为新创农村网络零售企业提升企业绩效提供理论指导。
得益于低廉的成本和丰富的地壳储量,钾离子电池被视为是锂离子电池潜在的替代者。但是,相比于Li+,K+不仅扩散速率更慢,而且半径更大,在材料中进行脱嵌时造成的体积膨胀更加剧烈,对结构的破坏更为严重,尤其对于钾离子电池负极材料。钴基氧化物、硫化物由于具有较高的放电比容量被视为钾离子电池的最佳负极材料候选者之一,但是由于K+脱嵌的过程对结构破坏十分严重,导致其倍率性能差、循环寿命短。而通过合理的结构设计