论文部分内容阅读
随着科技的不断进步,计算机存储和计算能力的增长使得我们能够处理更加复杂的数据。高维和海量是当今互联网时代数据的两大特点。异构数据和多模态数据的出现,带来了数据的高度冗余性和数据处理方法的不确定性。维数灾难导致许多传统的统计参数估计结果不再可信。高斯分布假设对于当今数据已经不再有效,高维协方差估计也是一个挑战的问题,必须引入先验知识,通过相应的正则化方法解决。因而,丰富多彩的现实数据特性,比如高维、稀疏、异构、低秩、结构化等,都将促进我们进行理论分析,并得到实际有用的指导性经验。
本文提出了耦合核嵌入的算法解决低分辨率图像特征提取与人脸识别问题,为异构数据的融合与匹配提供了新的途径。提出的新算法以较远距离拍摄的低分辨率图像识别为主要实验数据,获得了较好的实验效果。本文首次将多核学习框架应用于多分辨率分析,提出对于不同的尺度和旋转参数对应的变换系数进行稀疏加权,从而从大量的变换系数中自动挑选出少数最具有判别能力的小波子带。这种子带挑选方法有着十分重要的理论意义和应用价值,不仅减少了变换系数之间的高度冗余,而且为尺度和旋转参数赋予了良好的可解释性。本文进一步提出对原始数据样本进行加权,得到带有权重的期望和协方差矩阵估计方法,自动将那些在学习过程中起到积极作用的样本赋予较大的权值。该算法可以推广到其他与期望和协方差矩阵估计有关的算法里面。经验证,该算法与未经加权的算法得到的结果有着显著的统计差异。本文基于旋转不变的L1范数得到了新的稀疏表示模型和分类方法,新算法同时以L21范数为误差函数和惩罚函数,可以使得误差函数对于例外样本点较为鲁棒,并且可以得到带有群组效应的稀疏回归系数。新模型具有较好的光滑性,可以使用梯度下降法求得解析解。