联合稀疏正则化及其在特征选择中的应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wangyanling100wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,当今各种社会活动产生了海量的数据,同时数据的维度也呈现出爆发式的增长。海量的数据带来潜在价值的同时也带来了巨大的挑战。高维数据中的噪声、冗余以及不相关的特征降低学习模型的泛化能力和解释性,极大地增加了数据存储需求。甚至,目前的机器学习和数据挖掘算法在高维数据上不再适用。因此,对高维数据进行降维是数据分析中的一个非常重要的问题,也是一个基本问题。特征选择已经被证明是一种有效的降维技术之一,它是根据预先定义的准则,从原始特征集合中选择一个最佳的特征子集的过程。  近年来,由于稀疏性在理论上和实际应用中取得了很大的成果,稀疏学习已经被广泛应用于特征选择中,而且取得了巨大的成功。作为稀疏学习的一个基本组成部分,大量的稀疏正则化被提出并研究。由于凸的正则化容易求解,而且解是全局解,所以大量学者专注于研究凸的正则化。尽管凸的稀疏正则化被证明有很好的效果,但是任然存在一些情况,非凸正则化的效果要比凸正则化的效果好。同时,注意到,在许多领域中模型的变量是矩阵,比如多任务学习、多分类问题、神经网络等。然而,由于矩阵的形式相对复杂,研究矩阵稀疏度量的工作较少。为了使得特征选择更有效,本文针对矩阵提出两个非凸的稀疏度量,同时把它们做为联合稀疏正则化应用到特征选择中。针对联合稀疏正则化以及基于联合稀疏正则化的特征选择问题,本文主要做了以下几个方面的工作:  首先,本文针对矩阵提出了一个非凸的,但是是利普希茨(Lipschitz)连续的稀疏度量,它可以写成l2,1范数与Frobenius范数的差,把它记为l2,1-2。为了验证l2,1-2的有效性,它被做为联合稀疏正则化应用到有监督的特征选择中。为了使得l2,1-2具有更广的适用性,在特征选择模型中考虑了损失函数为一般形式。为了求解非凸模型,给出在凹凸程序(CCCP)框架下的迭代求解算法,并证明了CCCP算法的迭代点列是收敛的,且极限点为模型的稳定点。考虑到l2,1范数能有效地减少离群点和噪声的影响,在模型中使用l2,1范数做为损失函数,给出CCCP子问题的具体求解算法。凸的CCCP子问题可以很有效地被交替方向乘子法(ADMM)求解。在真实的数据集做了大量的实验证明了l2,1-2稀疏正则化在有监督特征选择的有效性。  其次,本文进一步把l2,1-2稀疏度量做为联合稀疏正则化应用到无监督特征选择中,提出基于l2,1-2稀疏正则化的无监督特征选择算法。据我们所知,这是首次在无监督特征选择中使用非凸的稀疏正则化。通过非负谱聚类算法,我们学习到样本点的归一化的聚类指示性矩阵,它可以被称为伪标签。利用伪标签,可以把有监督模型扩展到无监督情况。模型中的正交约束和非负约束使得学习到的聚类指示矩阵更加准确,有助于准确地选择相关特征。为了求解新提出的无监督特征选择模型,结合ADMM和CCCP设计了一个迭代算法,数值实验显示求解算法能很快找到模型的极小值点。为了验证新提出方法的效果,在真实数据集上的实验结果表明了新提出的方法的有效性。  最后,本文为矩阵提出另外一个非凸的,但是是Lipschitz连续的稀疏度量,把它命名为MCP2,并且把它应用到有监督的特征选择中,提出基于MCP2联合稀疏正则化的特征选择模型。本文给出了关于稀疏性的定理,表明当正则化参数超过某一个值时,模型的最优解的非零行能被控制。为了处理MCP2的非凸性,在CCCP的框架下设计一个迭代的求解算法。为了测试新提出稀疏度量在特征选择中的有效性,我们在真实数据集上做了一系列的实验。实验结果表明新提出的模型是有效的。
其他文献
该文较系统地介绍了一种新的学习机器--支撑向量机,以及一些相关概念和知识.文章首先对支撑向量机的理论基础--统计学习理论作了一个概述,并重点讨论了VC维有关的几个重要不
考虑一个吕立型NDDE.该文采用新方法时行讨论,给出方程初值问题解的解析公式及方程所有根具有负实部的充要条件,这些条件从对方程系数预报稳定性及非稳定性起很大作用.
对于任意的毕竟正则半群S,定义Con(S)上的二元关系K、T、U与Z如下(ρ、θ∈Con(S)).该文对其同余格上包含它的一些特殊同余的同余类K-类(T-类,U-类,Z-类)进行了讨论.该文还给
该论文为"汽车的动力性、燃料经济性模拟计算系统".该系统是为了满足汽车设计中各性能指标的计算而开发的.该系统可计算出最高车速及其对应档位、最大爬坡度、原地起步连续换
该文主要考虑具有给定法向量的曲线、曲面造型问题.此类问题的连续性比G1连续性强,但并不能由G(n≥2),C(n≥1)导出.在2D情形,我们分别采用圆弧、二次有理Bezier曲线及三次有
该文主要介绍作者本人硕士期间所作的部分工作.全文可以分为两个部分.第一部分通过野外测定获得黄土丘陵坡地不同土壤利用结构的表层土壤水分,依据影响该区土壤含水量的重要
该文研究的是含有吸收项的非Newton渗流方程(P-Laplace方程)初值问题解的渐进性.该文的目的是把牛顿渗流方程的某些结果推广到非Newton渗流方程.进而把赵俊宁的一个结果推广
本文主要在终端观测值给定的情形下,对一类重构二阶热传导方程的辐射系数的反问题进行了研究,这里的扩散系数是间断的。这类问题无论是在军事、医学、金融、物理、地质探测等领
该文研究初等动物三种捕食链模型,初等动物捕食模型的特点表现在捕食者捕食功能的描述为Holling Ⅰ型功能性反应函数.这个函数是连续、分段可微的.由于这个函数具有不可微点,
信赖域算法(Trust Region Algorithm)是求解非线性优化问题最常用的算法之一.该文回顾了无约束优化问题的信赖域算法的基本思想和理论,并非此基础上讨论了对传信赖域算法的一