人脸识别中的子空间学习算法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:sinking521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动人脸识别(AFR)系统是要赋予计算机像人类那样,具备根据人脸来辨别人物身份的能力。自动人脸识别研究具有重要的科学意义和巨大的应用前景。从学科建设与发展的角度看,人脸识别作为一个科学问题,是典型的图像模式的分析、理解与分类计算问题,涉及统计学,模式识别,计算机视觉,图像处理,图形学,认知科学等多个学科。一方面,人脸识别研究可以应用现有的学科知识积累,同时,人脸识别的研究也促进了这些学科的进步与发展。作为生物特征识别关键技术之一,人脸识别在公共安全、信息安全、金融、智能媒体等领域具有广泛的应用前景。经过四十多年的发展,人脸识别技术取得了长足的发展,目前最好的人脸识别系统在理想情况下已经能够取得可以接受的识别性能。但实践经验表明:非理想条件下的人脸识别技术还远未成熟。   子空间学习算法在人脸识别中占有非常重要的地位,它是人脸识别系统中不可或缺的一部分。自上世纪九十年代以来,对于人脸识别中子空间学习算法的研究就从未间断过,提出的算法模型也是层出不穷。但是,自从Eigenface(1990年)和Fisherface(1997年)提出后,虽然针对这两种算法的改进方法很多,却没有出现里程碑式的子空间学习算法。如何开发出一种快速、有效的子空间学习算法依然是需要解决的问题。因此,本文在深入分析Fisherface(PCA+LDA)中存在的问题的基础上提出了拉普拉斯平滑变换(LST)和基于支撑向量的判别分析(SVDA),并结合LST和SVDA,提出一种新的二步子空间学习算法。   本论文的主要贡献总结如下:   1.考虑到图像的特性,提出了拉普拉斯平滑变换(LST)方法   在人类的认知上,对于图像低频的信息更为敏感。本文中,我们首先基于图像的局部梯度,定义了一种。基于这种图像频率的定义,我们得到拉普拉斯矩阵。通过分解这个拉普拉斯矩阵,得到了拉普拉斯连续变换(LST)的基。LST将二维空间域的图像,映射成频域上的一维的向量。与主成分分析(PCA)比较,LST有以下优势:1)LST计算速度得到很大的提高,2)LST是一种独立于数据的变换,3)LST充分考虑图像的特性,即将图像看作是一个矩阵,并且考虑了每两个相邻像素之间的相关信息,而PCA则只是简单的将图像拉成一个向量,从而失去了图像本身的特性。实验结果表明,LST可有效去除人脸图像的高频信息,特别在ORL和Yale数据库上,我们首次得到了100%的识别精度(采用留一测试法)。   2.基于SVM,提出了基于支撑向量的判别分析(SVDA)方法   Vapnik等人提出的支撑向量机(SVM)是基于结构化风险最小的原则,并利用二次规划来求解的非常有效分类器,在模式识别中取得非常好的性能。在本文中,我们利用SVM,提出一种新的特征提取算法:基于支撑向量的判别分析(SVDA)。与LDA相比,SVDA有以下优点:1)SVDA是一种结构化方法,不需要LDA中高斯分布的前提假设;2)SVDA优先考虑了相隔很近的类别;3)SVDA可以得到多于类别数量的子空间维数。进一步我们引入核映射的思想,将SVDA方法扩展到核映射空间,从而可解决更为广泛的问题。在SVDA中,仅有支撑向量参与判别分析,而非支撑向量则被抛弃掉,这样可以大大降低核判别分析方法的计算复杂度。   3.结合LST与SVDA,提出了一种新的二步子空间学习算法   在人脸识别的发展中,有一个经典的方法Fisherface。Fisherface结合PCA与LDA,在人脸识别中取得了不错的效果。LST和SVDA分别改进了PCA和LDA,结合LST和SVDA,可得到新的二步子空间学习算法。其中LST去除人脸图像的高频噪音,而SVDA可在LST的频域上得到更有效区分的子空间。实验结果表明,LST+SVDA取得非常好的识别效果。   4.针对小样本学习问题,提出正交二次判别函数(OQDF)方法   二次判别函数(QDF)是基于贝叶斯理论的分类方法,需要估计的参数很多,尤其在小样本学习问题上,容易造成过拟合。在本文中,我们提出一种对分布函数的正则化方法,即:假设每两类样本的概率密度函数(PDF)具有一致的形状。在此基础上,我们提出了正交二次判别函数(OQDF)。OQDF大大减少了QDF中参数的数量,尽可能解决人脸识别中的过拟合问题。我们在子空间中使用OQDF作为分类器。实验结果表明,这种假设是合理的,并且可大大提高人脸识别的精度。
其他文献
铜绿假单胞菌(Pseudomonas aeruginosa)是一种条件致病菌,能够引起人体的急性和慢性感染。它的一个显著特征是对多种抗生素有较强的耐药性。三型分泌系统(Type III secretion sys
全光波长变换和全光逻辑门是实现全光网络的关键技术,基于半导体光放大器(SOA)非线性效应的全光波长转换器和全光逻辑门都可能在全光网络中得到应用。降低SOA的增益恢复时间是
生命探测是地震紧急救援的重点,而由于地震后的背景复杂,生命探测也是一大难点。传统的生命探测仪受到物理探头和产品价格的限制,在搜救中不能广泛的使用,因此,地震搜救亟待
本文分析了LTE中VOIP调度机制,指出在信道质量变差的情况下,信道资源利用率变低的问题,针对这一问题提出了改进算法,并设计了改进的调度机制。对现有机制的改进分为两点:一是信道
当前网络正处于飞速发展的时期,网络规模不断扩大,网络结构非常复杂,网络支撑的业务也日益丰富,这对网络管理提出了新的要求。传统网络管理系统在功能和结构上面的一些弊端也逐渐
棉花是较耐盐碱的作物之一,在盐碱地区有大面积种植,已取得良好的经济效益和社会效益。但棉花的耐盐能力仍然有限,常规品种耐盐能力一般只有0.3%。所以,要在盐碱地广泛种植棉
随着数字通信、计算机网络的飞速发展和互联网技术的普遍应用,多媒体通信已经成为一种不可避免的趋势。由于视频信息具有确定性、直观性、高效性等优越性能,视频传输在网络传
本文以植物化学和现代化学分离理论为基础,在黄硬皮马勃提取物抑菌活性跟踪检测的前提下,对其正丁醇萃取物的化学成分进行了分离纯化,在此基础上对分离得到的单体化合物进行了结
计算机在工业控制、数据采集系统中的大规模应用对计算机时间同步精度提出了较高的要求。目前计算机时间同步一般采用利用网络的NTP(网络时间同步)协议及串口直接时间同步法
信息时代中,面临知识爆炸和数据泛滥,人们需要从数据中挖掘出有用的信息、获取所需的知识、并对知识进行推理,为实际中的分析、预测和决策等问题提供科学的依据。数据中蕴含的概