论文部分内容阅读
虽然人脸识别技术现已广泛应用到许多场景中,比如安全监控、辅助相机聚焦等,但人脸识别技术仍然面临着许多挑战。其中一个实际应用中经常会遇到的问题是:训练与目标的人脸图像存在显著差异,从而导致训练得到的模型性能下降。该问题的根源在于传统的机器学习方法一般要求训练数据是对目标数据的良好描述,此时模型在训练数据上得到的性能在一定程度上代表其在目标数据上的性能,即训练误差可以是测试误差的良好估计。但是在实际应用当中,目标数据很可能来自与训练数据不同的分布,即目标数据对于模型来说是新的数据,因此模型无法有效应对这些新数据,从而导致人脸识别模型在目标数据上性能的退化。 解决上述问题的方法之一是迁移学习方法。迁移学习是通过将已有的知识迁移到新的数据场景下从而提升模型对新数据识别能力的方法。鉴于目前将迁移学习应用在人脸识别上的前人工作还很少,本文调研了机器学习等领域提出的迁移学习方法,在此基础上,针对目标域仅有无监督数据的情况,从三个不同的角度分析提出了基于迁移学习的解决方法: 1)提出了基于目标域相似度矩阵估计的判别性特征提取方法 源域上的监督信息虽然并不与目标域上的完全一致,但目标域与源域都是基于身份信息分类的,因此可利用源域上可靠的监督信息来指导目标域上类别信息的估计。目标域上的类别信息可采用样本间的相似度矩阵进行描述,即要求属于同类的样本具有非零且非常接近的相似度,而不同类样本间相似度为0。这样的相似度矩阵具有高度的判别性,且具有低秩的特性,其秩可用于衡量其域的判别性。因此,本方法旨在利用源域上的监督信息来指导目标域上具有高度判别性且低秩的相似度矩阵的估计。为了防止求解得到退化的相似度矩阵(比如秩为1),则需要求该相似度矩阵所描述的类的中心与属于该类的样本间距离较小。这个约束本方法将其形式化为目标域样本结合该相似度矩阵重构得到的样本与目标域样本间的误差应较小。由于估计目标域与源域遵循同一分类准则,则源域与目标域可共享同一判别性特征子空间,这要求源域与目标域在该子空间上能同时具有较好的判别性。其中目标域上采用相似度矩阵的秩、源域上采用Fisher准则定义的统计量来度量两个域的判别性。该方法提出可同时估计该特征子空间与目标域相似度矩阵的目标函数。由于低秩的相似度矩阵具有较好的判别性,因此可直接基于该相似度矩阵提取判别性的特征,而无需再利用无监督聚类进行类别估计。 2)提出了基于源域样本目标化的人脸识别方法 同样针对目标域无监督数据问题,该方法试图将源域上带类别标签的样本迁移至目标域,从而获得一批可用于训练目标域模型的监督样本。具体来说,该方法将源域与目标域视为两个流形,源域样本的目标化其本质为确定源域样本在目标域流形上的位置。该方法采用目标域样本对源域样本进行稀疏编码来学习源域样本在目标域流形上的局部空间位置关系。但是在原始空间上由于源域与目标域存在明显差异,直接对源域样本进行稀疏编码时会涉及部分无用甚至有害的信息,实际上无法学习得到可靠的迁移系数。因此本方法借助源域与目标域无明显差异的公共子空间来学习可靠的迁移稀疏。这是因为源域与目标域之间包含丰富可共享的信息,在该空间上源域样本相对于目标域样本的局部空间位置关系很大程度上体现了在原始空间上目标化后源域样本相对于目标域样本的空间位置关系。本方法采用稀疏重构误差度量域间差异,并采用拉普拉斯矩阵来保持局部结构以避免域上流形有用信息的丢失,结合这两个约束来优化公共子空间同时学习迁移系数。最后将优化得到的稀疏编码用于在原始空间上对源域样本进行目标化。 3)提出了融合公共与特有子空间上判别性特征提取的方法 当前基于公共子空间的迁移学习方法只利用到源域落在公共子空间上的监督信息,而忽略了目标域样本落在目标域特有子空间上的信息,而该信息亦可能对目标域上的分类问题有用。基于这一思路,该方法提出充分提取目标域整个空间上有用信息的融合方法。其中公共子空间上利用带标注源域所蕴含的可靠监督信息;目标域特有子空间上则利用无监督聚类的方法(比如Kmeans)来提取目标域样本空间位置关系中所蕴含的类别信息,在此基础上利用有监督的特征提取方法(例如LDA)来分别进行判别性的特征提取,最后融合这两部分判别性特征得到可对目标域整个特征子空间进行判别性信息提取的投影矩阵。在XM2VTS到FRGC等跨迁移实验上的结果表明该方法较只利用公共子空间上信息的迁移学习方法有更好的性能。