流形学习与基于稀疏化的半监督分类相关方法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:q546609271
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据的特征提取(或数据降维)及分类是数据建模与数据挖掘的基本问题,也是模式识别的关键与核心所在,而流形学习与半监督分类是近年来所兴起的数据特征提取(特别是低维特征表示)与分类中引人瞩目的热点方法。流形学习与半监督分类是缓解“高维少监督”问题的有效方法,具有十分重要的理论研究价值和实际应用价值。首先,它们涉及数学、计算机科学、信息科学、生物认知等多个领域,是新兴的前沿性的交叉科学研究。其次,流形学习与半监督分类促进了数学中多个领域的交叉。最后,流形学习与半监督分类在机器学习、数据挖掘以及模式识别等领域都有重要的应用。尽管流形学习与半监督分类在理论和应用上都取得了成功,但仍面临很多挑战性的问题,我们针对其中的一些关键性问题进行了深入的研究,取得了一系列创新成果:   1、针对流形学习方法的统一理解与综述问题,我们提出使用流形正则化框架。为了获得从高维表示空间到低维本质空间的降维映射,该框架力图拟合先验的低维表示指导信息,同时考虑降维映射的函数复杂度及其保持数据结构化信息的程度。依据此框架,我们将线性的与非线性的、无监督的与有监督的、单类的与多类的各种流形学习算法联系起来,从一个统一的角度理解它们,同时从此角度对它们进行了综述,并进一步探讨了它们之间的共性与差异。   2、针对处理半监督分类任务时的流形学习问题,即面对半监督分类时传统流形学习算法无法处理多流形数据、很难引入类别标签、缺乏显性映射的问题,我们采取“根据有标签数据的类别标签随机生成先验低维表示并对其进行拟合,同时保持数据稀疏结构”的策略,提出一种判别性保稀疏投影算法(Discriminative Sparsity Preserving Projection,DSPP)。DSPP是针对多流形数据设计的,具有显性的降维映射,还从数据稀疏表示中继承了较高的判别性能。实验证明,相比其它流形学习方法,DSPP在半监督分类方面有明显优势。   3、针对处理半监督分类任务时的流形学习问题,我们采取另外一种策略,即“多流形建模、非线性特征提取以及半监督判别分析”,从而提出一种多流形判别分析算法(Multi-Manifold Discrimillative Ahalysis,Multi-MDA)。Multi-MDA可构造能够有效地捕获多流形结构的邻域图,通过此图将数据点用其对应的蕴含着非线性结构信息的特征向量表示,进而针对构造的特征向量引入类别信息并建立线性的降维映射。实验结果也表明了所提的Multi-MDA在半监督分类任务中具有很好的判别性能。   4、针对鲁棒流形学习问题,即流形学习方法对奇异点不鲁棒的问题,我们以Isomap这一流形学习经典方法为切入点,提出了一种基于L1-范数距离度量的算法:Isomap-L1。在有奇异点存在的情况下,L1-范数已被证明比L2-范数具有更好的性能,因此我们基于L1-范数距离度量的策略具有更好的鲁棒性。实验结果也证明了我们所提的Isoma-L1对奇异点具有较好的鲁棒性。   5、针对半监督分类的模型假设问题,即半监督分类所基于的聚类假设与流形假设并非对所有数据集都适用的问题,我们提出了基于稀疏化假设的核稀疏正则化(Kernel-based Sparse Regularization,KSR)半监督分类方法。该方法在核特征空间中计算数据的稀疏表示,从而能够避免对非图像数据直接应用稀疏表示时可能会遭遇的“l2-范数问题”,然后通过在流形正则化框架下保持数据的稀疏表示系数来得到分类函数。KSR能够自适应进行邻域选择,具有较高判别性能,且具有显性的分类函数,能够处理在线分类任务。标准数据集上的实验结果证明了KSR的有效性。
其他文献
为了使现代工业机器人能够适用于复杂的工作如焊缝跟踪,灌装线的准确定位等,一种基于视觉信息的机器人控制方法—视觉伺服吸引了众多研究人员的关注。在现有机器人的视觉伺服系
随着电力系统输电电压等级和传输容量的不断提高,传统的电磁式电流互感器由于存在绝缘性能差、磁滞、磁饱和、精度低等缺点已难以满足当今社会的需要。光纤电流互感器由于具
多目标跟踪系统在军事和民用方面都有着广泛的应用,多目标跟踪算法是多目标跟踪系统的关键和难点。人们对于多目标跟踪算法已进行了半个多世纪的研究,提出了很多种多目标跟踪算
用户兴趣模型是个性化服务的关键组成部分,旨在发现和挖掘特定个体或群体的特征信息,从而为个性化服务的展开提供信息支持和决策依据。到目前为止,全球范围内对用户兴趣的研
异步起动永磁同步电机(Line-Start Permanent Magnet Synchronous Motor―LS-PMSM)是具有自起动能力的永磁同步电机,其兼具感应电动机和电励磁同步电动机的特点。该种电机采用
三维可视化技术的飞速发展及目前教学设备及方法存在弊端的现实,使虚拟实验室的建立成为推动教育模式信息化的有效方法,已逐步成为最近几年国内外实验课程教学研究和应用的热点
运动平衡技能来自于运动神经系统的学习,其中操作学习发挥了重要作用。探索运动神经系统中的操作学习机理,模拟和复制其中的自组织控制机制,并应用于机器人系统,使机器人通过学习
月面巡视器将是我国对地外星体表面开展探测工作的首个智能机器人。按照我国探月工程的实施计划,预计在2013年将实现探测器在月面的软着陆和对月面的巡视勘察。由于月面巡视器
随着现代城市的高速发展,每天都有大量的人流和物流需要输送。传统的悬吊式垂直提升系统,受制于钢绳材料构造等因素,提升高度和提升速度等都存在一定的限制。一般提升系统中,一台电机只能驱动一个轿厢,为提升运载能力,高层建筑建造时不得不投入更多面积用于提升系统。直线电机驱动的提升系统,打破了传统吊绳提升系统的限制。因此,直线电机驱动的提升系统作为一种可靠高效的提升系统,是未来提升系统的发展方向。本文总结了直
动态光散射技术是测量亚微米及纳米颗粒的有效方法,它通过散射光强的自相关函数获得颗粒粒度及其分布。但是单一角度的动态光散射技术,实验获得的测量信息少,反演获取的颗粒