基于核方法的节点分类研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:yifanjiawei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图结构数据,像交通运输网、地铁网络和社交网络等在现实世界中大量存在。因此,学习并理解图是机器学习中的关键。目前关于图的研究主要分为:图分类和节点分类。节点分类通过给定一个在某些节点上带有标签的网络,它将预测该网络上其他节点的标签,是网络挖掘中非常重要的任务。节点分类实际上是一个机器学习问题,它将机器学习中的分类模型应用到了网络中。节点分类本质是对已有的分类模型进行改进,使其获得更好的分类效果。图表示学习中的图卷积网络作为卷积神经网络在图数据处理中的扩展,在节点分类任务中获得了满意的评价,并已成功应用于网络分析中的节点分类任务。
  现有图卷积网络在节点分类存在一些问题。首先,图卷积网络使用的是具有图结构的网络数据,不适用于没有图结构的数据。其次,原始数据属性之间通常包含非线性关系,这在低维空间中很难捕获,而目前的图卷积网络并没有考虑到数据属性之间的非线性关系。再次,原始的数据通常包含噪点和冗余特征,这些会对构造的图表示产生不好的影响,从而影响节点分类结果。此外,目前大多数图卷积网络使用的是单一的欧式距离来计算两个样本之间的距离,它将样本的不同属性(即各指标或各变量)之间的差别等同看待,这一点有时不能满足实际要求而且单距离度量学习可能出现过拟合问题。本文针对上述图卷积网络在节点分类中存在的问题结合图表示学习、核方法、特征选择、稀疏学习等理论提出了两种改进的卷积网络算法以用于节点分类任务。其核心内容和原创点如下:
  1.针对目前大多数图卷积网络仅适用于图结构数据,原始的欧几里得数据通常包含噪点和冗余信息以及数据属性之间存在非线性关系。本文提出了一种新的非线性图学习卷积网络算法。该算法首先利用核函数比如高斯核函数将原始欧几里得数据映射到核空间,使得原始欧几里得数据线性可分,以此来捕获数据属性之间的非线性关系,然后使用基于结构信息的特征选择方法来去除噪点和冗余特征来构造一个高质量的图表示,最后使用一个常用的图卷积网络来进行节点分类任务。
  2.针对目前大多数图卷积网络使用单一欧式距离来计算两个样本之间的距离而易出现过拟合,本文提出了一种新的多图核卷积网络算法。该算法首先使用多距离度量方法比如M氏距离获得多个可训练的距离度量。这多个可训练的距离度量就对应了多个图,每个图一个距离矩阵。该算法对输入的节点使用特征映射函数,来充分学习局部顶点特征信息和图拓扑信息,从而得到新的节点表示。然后通过距离矩阵和新的节点表示构造每个图的混合核函数,该混合核函数由一个基本核函数以及每个图构造的有效核函数构成。通过求解每个图的混合核函数,得到每个图的节点表示。最后本文通过一个池化对所有的节点表示进行批处理和归一化操作,利用池化后的结果进行节点分类性能的评估。
  总之,本文提出的方法有效解决了目前图卷积网络的一些问题,如大多数图卷积网络仅适用于图结构数据、原始的数据通常包含噪点和冗余信息、数据间的非线性关系、单距离度量学习可能出现过拟合等问题。本文提出的方法在不同的评价指标上获得更好的节点分类性能。在未来的工作中,本人将考虑其他图卷积网络中存在的问题,例如高度非线性、结构保留、属性保留、稀疏性等,提出新的解决方案。
其他文献
随着现在社会计算机技术的迅速发展,图像处理技术在纺织业、仪器仪表制造业等工业制造领域的应用越来越广泛。针对多数纽扣生产厂家采用人工方式进行纽扣质量检测和计数,导致检测效率较低的问题,设计了基于图像处理的纽扣瑕疵检测与计数系统。主要分为纽扣检测与定位、带孔塑料纽扣的瑕疵检测、带文字图案金属纽扣的瑕疵检测和纽扣计数这四部分。纽扣检测与定位部分主要目的是实现ROI区域的定位与提取。设计了两种纽扣检测方法
学位
MEMS扫描微镜是伴随着微机电系统技术的快速发展而逐渐得到广泛关注的一种微型光学器件,由于其具有体积小、成本低、功耗低、灵敏度高、可批量生产等许多优良特性,因此在高清投影显示、现代光学通讯、以及下一代激光雷达等诸多领域有着十分广阔的应用前景。近年来,国内外大量的研究员对MEMS扫描微镜展开深入的研究,通过分析微镜所固有的特性,设计该系统的控制器来提高微镜的性能,MEMS扫描微镜的控制已经逐渐成为一
学位
学位
学位
阴影在自然界中无所不在,它由于在光传播途径中存在遮挡物而产生。阴影的出现有利有弊,弊端在于它会干扰许多现有的图像、视频的处理与分析任务,而有利点在于阴影其实隐含了光源和场景中的物体信息,有利于场景中的目标理解。因此研究阴影的检测与去除方法兼具理论与现实意义,但它历来也被认为是机器视觉中一个极富挑战性的任务。阴影的检测算法按其特征的设计思路分为传统的基于人为构建特征的检测与利用深度学习网络进行检测这
学位
学位
学位
视频哈希作为数字媒体内容安全领域的一个重要研究课题,近年来受到研究人员的广泛关注,现已成功应用于视频拷贝检测、视频认证、视频检索和视频篡改检测等方面。视频哈希算法可以从一个输入视频中提取出一串基于内容的、简短的数字或比特序列,该序列称为输入视频的视频哈希。在实际应用中,可以用视频哈希来代表视频本身,有效地降低视频的存储代价和视频相似计算的复杂度。通常,视频哈希算法应该满足两个基本属性,即鲁棒性和唯
学位
图像描述主要解决的问题是如何使用自然语言自动描述图像的内容,该研究主要涉及了计算机视觉和自然语言处理两个研究领域,是人工智能中一项重要的研究工作。随着数字图像的广泛使用和传播,其信息价值飞速增长,图像描述作为图像与自然语言的桥梁,具有广阔的应用前景。图像描述可广泛应用于图像检索、语义视觉搜索、多模态检索、对话机器人的视觉智能、视障辅助、军情侦察、智能监控等。  本论文研究细粒度图像描述方法,使计算
互联网不断地发展带来了海量的高维数据,其特点是维度众多,而其中许多维度价值密度相对较低。如何在众多维度中找到价值高的维度,是许多研究者研究的问题;而且由于数据的快速增长以及赋予数据类别标签的成本高昂,越来越多的数据没有标签。因此,特征选择、半监督学习成为研究的热点。此外,由于图模型可以模拟数据的流形结构,有很好的数据表达能力,因而结合特征选择、半监督以及图学习理论的基于图的半监督特征选择进入大家的