多视角学习理论与算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dddddddaaaaaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞速发展,数据的收集和存储能力得到了极大地提高,在科学研究和社会生活的各个领域,海量表现形式复杂的数据涌现。针对同一对象从不同途径或不同层面获得的特征数据被称为多视角数据(Multi-view data)。多视角学习(Multi-view learning)是指利用事物的多视角数据,对其内在模式进行识别和学习。在机器学习领域,如何综合利用多视角数据进行充分有效地学习,实现对由多视角所刻画的对象的深入理解与分析,已成为该领域的一个热点问题,这一研究具有重要的理论意义与应用价值。  为了更好地挖掘其中的信息,多视角学习需要遵循两个原则:一致性原则和互补性原则。一致性原则是指同一对象不同视角的特征存在内在联系,通过最大化多个不同视角之间的一致性,产生具有更好泛化能力的模型。互补性原则是指不同视角数据间的差异性使得每个视角都包含对象某一方面独特的信息,通过利用此类相互补充的信息,全面而准确地描述数据。为确保多视角学习取得成功,一致性和互补性两原则在多视角学习中起着相当重要的作用。目前的大部分研究工作要么遵循一致性原则,要么遵循互补性原则,同时遵循这两个原则的研究工作还比较少,值得更多的研究人员关注。  本文主要研究多视角学习的理论与方法。以已有的多视角学习理论与方法为基础,以一致性和互补性原则为指导,以最优化理论与方法为工具,系统地构建新的理论框架,在此框架下进行一系列的模型与算法研究。主要包括:开发基于特权信息学习理论下的两视角支持向量机,多视角支持向量机及半监督两视角支持向量机。同时,基于非平行支持向量机构建多视角非平行支持向量机。本文的主要工作如下:  (1)两视角支持向量机(PSVM-2V)以将特权信息学习策略(Learning Using Privileged Information,LUPI)应用于多视角学习的思路为主导,构建新的两视角支持向量机(Privileged SVM for two-view learning,PSVM-2V),并进行相应的算法研究。同时,利用Rademacher复杂度理论,对模型进行了相应的理论分析,并通过大量的数值实验验证模型和算法的合理有效性,实验结果表明,在大部分的多视角数据集上,PSVM-2V提高了分类准确率,并且这种提高具有统计显著性。  (2)多视角支持向量机(IPSVM-MV)将两视角支持向量机(PSVM-2V)拓展到多个视角上,提出多视角支持向量机(Improved privileged SVM for multiview learning,IPSVM-MV),该模型通过直接继承LUPI学习范式下的经典模型SVMΔ+,更为充分地利用多视角数据间的互补信息。通过采用交替方向乘子法(Alternating direction method of multipliers,ADMM),对其进行快速求解。进一步,从理论上分析了IPSVM-MV的一致性和泛化能力,并与PSVM-2V进行了全面比较。最后,通过大量数值实验验证了IPSVM-MV的有效性,实验结果表明,在大多数多视角数据集上,IPSVM-MV具有比PSVM-2V更高的分类准确率。  (3)多视角非平行支持向量机(MVNPSVM)基于非平行支持向量机(Nonparallel support vector machine,NPSVM)的相关理论与方法,提出了多视角非平行支持向量机(Multi-view nonparallel support vector machine,MVNPSVM),该模型不仅继承了NPSVM和多视角数据的优势,而且是NPSVM分类器在多视角学习领域的新拓展。我们采用交替方向乘子法(ADMM)对其进行快速求解。进一步,从理论上分析了MVNPSVM的一致性,并与SVM-2K和MvTSVMs进行比较。最后,通过大量的数值实验证明了所提出的模型与算法的有效性。  (4)半监督两视角支持向量机(SPSVM-2V)基于两视角支持向量机(PSVM-2V)和拉普拉斯正则化(Laplacian regularization),提出了一种新的半监督两视角支持向量机(Semi-supervised two-view privileged support vector machine,SPSVM-2V)。通过合适的参数设置,SPSVM-2V可以退化为PSVM-2V。此外,针对SPSVM-2V设计了有效的求解算法,并利用Rademacher复杂度理论对模型进行理论分析。数值实验验证了该模型和算法的有效性。  本文所提出的四种多视角学习模型丰富和完善多视角学习的理论研究和方法体系,为多视角学习提供新思路和新模型。在此基础之上,所提出的有趣而富有挑战性的新问题,也为我们未来的研究工作奠定了基础。
其他文献
该文的工作主要分为三部分.首先,研究自由四眯法曲线和曲面所需的自然边界条件问题,提出了一个简单线性的四点法曲线曲面的自然边界条件,较通常的自然边界条件大为简化,很好
最优嵌入问题是从稀疏矩阵计算,纠错码,数据结构,VLSI及分子生物学等中撮出来的数学模型,有着广泛的应用背景.该文所涉及的图均为无向,简单有限图.该文由以下几部分组成:i.二
稀疏恢复是许多应用领域的关键问题,包括信号处理,压缩感知,机器学习和计算机视觉等等。例如,信号的稀疏表示可以处理由字典冗余而造成的表示不唯一性。多视角学习中,联合稀疏表示
阅读教学是小学语文教学的重要内容,是学生个性化行为的体现.本文分析了当前小学语文个性化阅读教学存在的问题,并基于此,阐述了基于个性化教学的小学语文阅读教学策略.本文
图像的边缘是图像最基本也是最重要的特征之一。边缘检测是计算机视觉和图像处理领域内最经典的研究课题之一。图像分析和理解的第一步常常是边缘 检测。边缘检
PRP算法是求解大规模最优化问题的最受欢迎的共轭梯度法之一,然而,当采用非精确线性搜索时,算法产生方向可能不是下降方向,为了克服这一缺陷,目前已经提出了关于该算法的多种修正
该文系统地研究了取值在泛Clifford代数C(Vn.s)上的超复函数的性质以及取值在Clifford代数C(Vn,o)上相应的Clifford分析中的某些Riemann边值问题与奇异积分方程.其主要内容包
本文主要研究H(curl)-椭圆问题的自适应混合内罚间断有限元方法的收敛性.该方法通过引进一个新的中间变量,从而得到H(curl)-椭圆问题的混合模型,然后给出了相应的连续变分问题
中国共产党第十六届中央委员会第四次全体会议通过的《中共中央关于加强党的执政能力建设的决定》,主题鲜明,立意高远,内涵十分丰富。重点尤为突出,提出了许多新观点、新思
文言文是我国先辈遗留下来的宝贵文化遗产,选入初中语文课本的文言文更是其中的典范之作,学习它们,既有助于继承祖国博大的传统文化,又能促进学生对现代汉语的理解。然而现在