基于分布保持的特征提取方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:boy1000cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的快速发展,模式识别已在各行各业受到了广泛地关注,并已成为当今社会生活中的实际应用。模式识别研究内容包括了数学、机器学习、计算机视觉、人工智能、神经科学以及认知科学等多门学科,是一个具有挑战性的理论研究难点,也是一个快速发展的挑战性应用问题。作为模式识别的核心内容,特征提取主要研究如何从高维观测数据中学习到有利于识别任务的判别属性,特征提取模型的质量直接决定着模式识别的性能。特征提取研究是当前模式识别领域的热点问题之一。
  现有模型基本是在欧式距离下取得数据的最优低维表示,没有考虑隐藏在高维数据中的非线性流形结构。而且基于欧式距离的模型不能保证把具有较大内在曲率的流形结构映射到本征维嵌入空间中。本文采用核密度估计方法来近似隐藏在高维数据空间中的本征维流形结构,提出了多个基于分布保持嵌入学习的非线性特征提取模型来消除数据较大内在曲率,并分别从监督分类,无监督聚类,半监督分类的角度来验证这些特征提取模型性能。论文的主要内容和创新点可归纳如下:
  ① 基于边缘平滑的分布保持超球嵌入学习
  提出了一种基于边缘平滑的分布保持超球面嵌入模型,并应用于高光谱数据特征提取中。具体是在用光谱特征向量估计每个像素点的分布时,充分利用高光谱数据的空间信息和强度信息,通过边缘停止函数平滑估计的分布来检测真实对象边缘信息。该模型能够捕获嵌入在高光谱数据中的内在几何结构,然后尽可能地将这些结构保持在较低维度的超球面嵌入空间中。三个常用高光谱数据集的实验结果也表明该模型可提取到高光谱数据的内在几何结构并显著提高监督分类识别性能。
  ② 基于分布保持的深度半非负矩阵分解
  提出了基于分布保持的深度半非负矩阵分解模型,该模型是从聚类的角度出发,能根据观测数据的未知属性并通过深度半非负矩阵分解技术获得隐藏在数据中的分层表示。另一方面,每个数据聚类簇的内在几何结构都可通过簇内数据的分布来描述。在该模型中,通过核密度估计方法来近似数据的流形结构,然后通过显式地保持两个分布的一致性来达到分层投影过程中数据流形结构不变目的。该方法可在判别投影空间中比较完整地保留嵌入在原始高维数据空间的内在几何结构,无监督聚类实验结果也验证了该模型的有效性。并设计了一种自适应方法来快速优化该模型的约束目标函数。
  ③ 基于分布保持的深度局部嵌入学习
  提出了分布保持网络嵌入模型,该模型利用权重约束为非负的深度自编码网络来学习数据的低维局部嵌入表示。在该方法中,使用邻域核密度估计来揭示隐藏在高维数据空间中的本征维流形结构,然后寻求数据深度局部嵌入,并使其遵循上述内在流形结构,该方法通过引入分布一致性正则项达到流形结构保持不变目的。此外,在图像和文本数据集上的无监督聚类结果也表明相比于其它传统和深度嵌入方法,该方法能更好地在嵌入空间中保持隐藏在高维数据空间中的内在流形结构。
  ④ 基于分布保持的半监督深度嵌入学习
  提出了分布保持半监督深度嵌入模型,主要解决半监督学习框架中基于欧式距离的方法无法捕获少量有标签数据和大量无标签数据之间的流形结构这个问题。因数据分布能近似嵌入在高维数据空间中的本征维流形结构,同一类样本点位于连续高密度区域内,不同类样本通过一些低密度区域连接,故在深度模型中利用分布保持显式地结合少量有标签样本和大量无标签样本的内在几何结构信息,使得该模型相比于其它半监督学习方法既能学习到一个有效的分类决策面,又能学习到保持数据内在几何流形结构的低维嵌入。此外,在图像数据集上的半监督识别结果也表明该方法能学习到一个有效的分类决策面。
其他文献
随着日益普及的智能设备和迅猛发展的社交网络、社会媒体,数字图像和视频作为记录视觉信息的主要载体,正在快速地改变着人们的生活、生产方式。爆炸式增长的图像、视频数据既带来了数据量巨大、存储处理困难等挑战,也提供了深度挖掘、理解图像/视频数据等机遇。不同于目标分类和检测,目标分割作为一种高层次、细粒度的图像/视频解析任务,能够对指定类型的目标进行精确的定位并提供详细的边界信息,并在自动驾驶、视频编辑、图
学位
量子网络是在量子系统之间实现信息传输、建立量子关联的重要媒介,它满足了量子信息系统的扩展需求,在量子信息技术由理论实验走向大规模实用化的过程中发挥着关键性的作用。本文工作围绕解决量子网络构建中的典型问题以及扩展量子网络的应用领域展开,分别对量子消相干的建模与分析、量子态的传输与存储、量子系统的消相干控制、基于量子网络的远程量子博弈以及对博弈问题量子化方式的扩展五个方面的问题进行了研究。本文的主要研
学位
近年来,随着互联网技术和在线社交网络的发展,人们可以随时随地创作、浏览、转发、评论各种信息,在个人创作和消费信息的同时提高了信息在时空传播的效率。与广播、电视、报纸等大众传媒相比,在线社交网络从根本上改变了信息传播的方式和机理,逐渐成为信息发布和传播的主流平台。社交网络信息传播的相关研究,不但能够帮助人们认识社交网络本身,解释网络群体行为规律,预测信息传播趋势,而且在公共舆论导控、精准市场营销、信
学位
运动目标行为分析是无人车研究的难点问题,本文着眼于提高无人车复杂环境下的场景理解能力,以相关性表示为切入点,开展运动目标行为分析方法研究。论文的主要研究成果和创新点如下:  1.提出一种基于时空显著性的级联相关滤波算法。该算法深入研究序贯图像中的目标行为特性,利用相关滤波方法对目标行为特征进行在线建模,并针对相关滤波算法固有的边缘效应问题,研究多层次特征的级联表示,利用高层次特征表示整体语义,提升
学位
高质量的预测结果对人们的生产生活具有重要的指导意义,有利于人们制定出更可靠的决策方案。预测是根据事物过去发展的现律,估计其未来发展趋势的一种理论。近十几年,各领域专家学者提出了数以万计的预测方法,预测学科得到了突飞猛进的发展。随着大数据时代的到来,挖掘海量非结构化和半结构化数据中蕴含的信息对预测方法提出了新的挑战。同时,如何提高预测方法在特定领域的精度成为了一个预测研究的重要研究方向。深度信念网络
学位
复杂任务往往需要异构多智能体合作才能完成,而联盟是实现合作的重要方法之一。同时,在分布式系统中,通信是多智能体合作执行任务的前提。因此,在同时承担通信和任务执行的条件下,智能体如何合理有效地组建联盟是提高多智能体系统应对复杂任务的关键之一。然而,适合于通信的联盟结构(Coalition Structure,CS)不一定适合于合作完成任务,适合于合作完成任务的联盟结构也不一定能满足通信的要求;因此,
学位
由于决策与人的思维和认识有着密切的关系,决定了决策科学是一个十分复杂的系统科学。在许多现实的决策过程中,由于决策问题自身的复杂性、不确定性和人类思维、认识的模糊性及参与决策的专家个人偏好等不确定性,形成了一类包含语言值数据的不确定决策问题,这类含有语言信息的决策问题一直是决策科学研究的一个难点。  Zadeh教授于上个世纪六十年代建立的模糊集理论,为人们处理模糊的语言信息提供了有力的工具。但是,在
该文所做的工作主要就是围绕其中的图像特征和高维索引展开的.图像特征的重要性在于它是图像检索的基础,一个好的图像检索系统必须能够提取出最能描述图像内容的特征来,否则后面的相似性检索就无从谈起.在诸多特征中,色彩特征是最为常用的一种.它不仅有良好的视觉特性,在复杂背景下有较强的鲁棒性,而且对图像尺寸和拍摄视角等具有相对的独立性.所以也是被使用最广的.目前对于色彩特征的研究,已经从早期的直方图发展到了结
学位
交通流量预测是指通过历史交通数据估计在未来某一时段某一指定区域通过的车辆数量。交通流量预测是智能交通系统的一个重要组成部分,其预测精度对于交通控制系统的有效实现具有重要的意义。虽然交通流量预测问题已研究长达数十年,但是现有的预测方法仍然存在一些不足。这些不足主要表现在:浅层模型难以揭示交通流量数据的内在时空关系;许多方法将特征学习和回归预测分离,使得模型性能下降;手工提取特征不能适应问题的复杂性;
科学技术的发展,尤其是智能移动互联和物联网相关技术的普及,影响了数据的维度、大小、种类以及产生方式,增加了数据的复杂度,从而使数据的标注愈加困难。所以,如何在类标未知的样本中解决模式识别的相关问题成了无监督学习应用的背景。在无监督学习中,聚类和异常检测是两类广泛使用的方法。  早在《战国策.齐策三》中,我们的先人就提出了“物以类聚,人以群分”的思想。近年来,密度代表点这一概念被广泛应用于聚类分析领
学位