论文部分内容阅读
自动人脸识别(AFR)系统是要赋予计算机像人类那样,具备根据人脸来辨别人物身份的能力。自动人脸识别研究具有重要的科学意义和巨大的应用前景。从学科建设与发展的角度看,人脸识别作为一个科学问题,是典型的图像模式的分析、理解与分类计算问题,涉及统计学,模式识别,计算机视觉,图像处理,图形学,认知科学等多个学科。一方面,人脸识别研究可以应用现有的学科知识积累,同时,人脸识别的研究也促进了这些学科的进步与发展。作为生物特征识别关键技术之一,人脸识别在公共安全、信息安全、金融、智能媒体等领域具有广泛的应用前景。经过四十多年的发展,人脸识别技术取得了长足的发展,目前最好的人脸识别系统在理想情况下已经能够取得可以接受的识别性能。但实践经验表明:非理想条件下的人脸识别技术还远未成熟。
子空间学习算法在人脸识别中占有非常重要的地位,它是人脸识别系统中不可或缺的一部分。自上世纪九十年代以来,对于人脸识别中子空间学习算法的研究就从未间断过,提出的算法模型也是层出不穷。但是,自从Eigenface(1990年)和Fisherface(1997年)提出后,虽然针对这两种算法的改进方法很多,却没有出现里程碑式的子空间学习算法。如何开发出一种快速、有效的子空间学习算法依然是需要解决的问题。因此,本文在深入分析Fisherface(PCA+LDA)中存在的问题的基础上提出了拉普拉斯平滑变换(LST)和基于支撑向量的判别分析(SVDA),并结合LST和SVDA,提出一种新的二步子空间学习算法。
本论文的主要贡献总结如下:
1.考虑到图像的特性,提出了拉普拉斯平滑变换(LST)方法
在人类的认知上,对于图像低频的信息更为敏感。本文中,我们首先基于图像的局部梯度,定义了一种。基于这种图像频率的定义,我们得到拉普拉斯矩阵。通过分解这个拉普拉斯矩阵,得到了拉普拉斯连续变换(LST)的基。LST将二维空间域的图像,映射成频域上的一维的向量。与主成分分析(PCA)比较,LST有以下优势:1)LST计算速度得到很大的提高,2)LST是一种独立于数据的变换,3)LST充分考虑图像的特性,即将图像看作是一个矩阵,并且考虑了每两个相邻像素之间的相关信息,而PCA则只是简单的将图像拉成一个向量,从而失去了图像本身的特性。实验结果表明,LST可有效去除人脸图像的高频信息,特别在ORL和Yale数据库上,我们首次得到了100%的识别精度(采用留一测试法)。
2.基于SVM,提出了基于支撑向量的判别分析(SVDA)方法
Vapnik等人提出的支撑向量机(SVM)是基于结构化风险最小的原则,并利用二次规划来求解的非常有效分类器,在模式识别中取得非常好的性能。在本文中,我们利用SVM,提出一种新的特征提取算法:基于支撑向量的判别分析(SVDA)。与LDA相比,SVDA有以下优点:1)SVDA是一种结构化方法,不需要LDA中高斯分布的前提假设;2)SVDA优先考虑了相隔很近的类别;3)SVDA可以得到多于类别数量的子空间维数。进一步我们引入核映射的思想,将SVDA方法扩展到核映射空间,从而可解决更为广泛的问题。在SVDA中,仅有支撑向量参与判别分析,而非支撑向量则被抛弃掉,这样可以大大降低核判别分析方法的计算复杂度。
3.结合LST与SVDA,提出了一种新的二步子空间学习算法
在人脸识别的发展中,有一个经典的方法Fisherface。Fisherface结合PCA与LDA,在人脸识别中取得了不错的效果。LST和SVDA分别改进了PCA和LDA,结合LST和SVDA,可得到新的二步子空间学习算法。其中LST去除人脸图像的高频噪音,而SVDA可在LST的频域上得到更有效区分的子空间。实验结果表明,LST+SVDA取得非常好的识别效果。
4.针对小样本学习问题,提出正交二次判别函数(OQDF)方法
二次判别函数(QDF)是基于贝叶斯理论的分类方法,需要估计的参数很多,尤其在小样本学习问题上,容易造成过拟合。在本文中,我们提出一种对分布函数的正则化方法,即:假设每两类样本的概率密度函数(PDF)具有一致的形状。在此基础上,我们提出了正交二次判别函数(OQDF)。OQDF大大减少了QDF中参数的数量,尽可能解决人脸识别中的过拟合问题。我们在子空间中使用OQDF作为分类器。实验结果表明,这种假设是合理的,并且可大大提高人脸识别的精度。