基于迁移学习的人脸识别

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:funkfood
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然人脸识别技术现已广泛应用到许多场景中,比如安全监控、辅助相机聚焦等,但人脸识别技术仍然面临着许多挑战。其中一个实际应用中经常会遇到的问题是:训练与目标的人脸图像存在显著差异,从而导致训练得到的模型性能下降。该问题的根源在于传统的机器学习方法一般要求训练数据是对目标数据的良好描述,此时模型在训练数据上得到的性能在一定程度上代表其在目标数据上的性能,即训练误差可以是测试误差的良好估计。但是在实际应用当中,目标数据很可能来自与训练数据不同的分布,即目标数据对于模型来说是新的数据,因此模型无法有效应对这些新数据,从而导致人脸识别模型在目标数据上性能的退化。  解决上述问题的方法之一是迁移学习方法。迁移学习是通过将已有的知识迁移到新的数据场景下从而提升模型对新数据识别能力的方法。鉴于目前将迁移学习应用在人脸识别上的前人工作还很少,本文调研了机器学习等领域提出的迁移学习方法,在此基础上,针对目标域仅有无监督数据的情况,从三个不同的角度分析提出了基于迁移学习的解决方法:  1)提出了基于目标域相似度矩阵估计的判别性特征提取方法  源域上的监督信息虽然并不与目标域上的完全一致,但目标域与源域都是基于身份信息分类的,因此可利用源域上可靠的监督信息来指导目标域上类别信息的估计。目标域上的类别信息可采用样本间的相似度矩阵进行描述,即要求属于同类的样本具有非零且非常接近的相似度,而不同类样本间相似度为0。这样的相似度矩阵具有高度的判别性,且具有低秩的特性,其秩可用于衡量其域的判别性。因此,本方法旨在利用源域上的监督信息来指导目标域上具有高度判别性且低秩的相似度矩阵的估计。为了防止求解得到退化的相似度矩阵(比如秩为1),则需要求该相似度矩阵所描述的类的中心与属于该类的样本间距离较小。这个约束本方法将其形式化为目标域样本结合该相似度矩阵重构得到的样本与目标域样本间的误差应较小。由于估计目标域与源域遵循同一分类准则,则源域与目标域可共享同一判别性特征子空间,这要求源域与目标域在该子空间上能同时具有较好的判别性。其中目标域上采用相似度矩阵的秩、源域上采用Fisher准则定义的统计量来度量两个域的判别性。该方法提出可同时估计该特征子空间与目标域相似度矩阵的目标函数。由于低秩的相似度矩阵具有较好的判别性,因此可直接基于该相似度矩阵提取判别性的特征,而无需再利用无监督聚类进行类别估计。  2)提出了基于源域样本目标化的人脸识别方法  同样针对目标域无监督数据问题,该方法试图将源域上带类别标签的样本迁移至目标域,从而获得一批可用于训练目标域模型的监督样本。具体来说,该方法将源域与目标域视为两个流形,源域样本的目标化其本质为确定源域样本在目标域流形上的位置。该方法采用目标域样本对源域样本进行稀疏编码来学习源域样本在目标域流形上的局部空间位置关系。但是在原始空间上由于源域与目标域存在明显差异,直接对源域样本进行稀疏编码时会涉及部分无用甚至有害的信息,实际上无法学习得到可靠的迁移系数。因此本方法借助源域与目标域无明显差异的公共子空间来学习可靠的迁移稀疏。这是因为源域与目标域之间包含丰富可共享的信息,在该空间上源域样本相对于目标域样本的局部空间位置关系很大程度上体现了在原始空间上目标化后源域样本相对于目标域样本的空间位置关系。本方法采用稀疏重构误差度量域间差异,并采用拉普拉斯矩阵来保持局部结构以避免域上流形有用信息的丢失,结合这两个约束来优化公共子空间同时学习迁移系数。最后将优化得到的稀疏编码用于在原始空间上对源域样本进行目标化。  3)提出了融合公共与特有子空间上判别性特征提取的方法  当前基于公共子空间的迁移学习方法只利用到源域落在公共子空间上的监督信息,而忽略了目标域样本落在目标域特有子空间上的信息,而该信息亦可能对目标域上的分类问题有用。基于这一思路,该方法提出充分提取目标域整个空间上有用信息的融合方法。其中公共子空间上利用带标注源域所蕴含的可靠监督信息;目标域特有子空间上则利用无监督聚类的方法(比如Kmeans)来提取目标域样本空间位置关系中所蕴含的类别信息,在此基础上利用有监督的特征提取方法(例如LDA)来分别进行判别性的特征提取,最后融合这两部分判别性特征得到可对目标域整个特征子空间进行判别性信息提取的投影矩阵。在XM2VTS到FRGC等跨迁移实验上的结果表明该方法较只利用公共子空间上信息的迁移学习方法有更好的性能。
其他文献
深度学习是机器学习领域中比较新兴的方向,很多研究者相信通过对它的研究,可以达到机器学习的一个本质目的——人工智能。本文主要研究了如何将深度学习应用于行人重现检测技术
高性能计算对科学技术的进步、经济社会的发展起着不可估量的作用,除对性能的追求以外,高能效在高性能计算领域也受到越来越多的重视。面向应用的定制计算是提高计算效能的有效
随着普适计算和物联网的发展,衍生出一类基于位置服务的应用。目前基于位置服务已得到了迅猛的发展,并广泛应用于场馆定位导航、移动互联网应用、资产管理、人员定位、物流管理
我国是一个地质灾害频发的国家,每年地质灾害给国民经济和人们生活带来的创伤是难以计数的。地质灾难不仅给民众的生活安定带来了严重的影响,更严重的牵涉到国家的重大经济决
学位
耦合器是地球系统模式重要组成部分,用于连接各个分量模式。中科院地球系统模式CAS-ESM中使用的CPL耦合器在增加新类型的分量模式、添加耦合物理量、设置耦合频率等环节需要对
现代信息化社会,数据呈现爆炸式增长。这会带来三个方面的严重问题,即存储和管理数据的成本越来越高,数据备份和恢复的时间越来越长,以及数据中心的能耗越来越严重。重复数据删除
体光照技术在可视化和影视特效中有着广泛的应用。不同于一般的体绘制,体光照算法是一种计算体数据全局光照的技术,能够模拟光在体数据中真实散射的情况。通过该技术可以模拟基
物体分割是许多计算机视觉和图像处理问题的重要处理步骤,应用在物体识别、场景理解、图像编辑等相关任务中。因此,物体分割具有重要的研究价值和意义。物体类别的类内多样性,同
倒排索引是Web搜索引擎的核心数据结构,也是目前为止被认为最高效的大规模文本索引方法。随着互联网络的发展,数据规模和用户数量相比早期都有了质的飞跃,这给Web搜索引擎的性能