论文部分内容阅读
图作为一种无处不在的数据结构,因其强大的表示能力,广泛存在于社交网络、推荐系统、生物化学和金融系统等领域中。由于这些图数据中往往存储着很多有价值的信息,不少学者进行图数据研究以探索数据中的重要信息,其中节点分类是图数据研究中的一项热门任务。例如,在蛋白质分子网络中,通过分析蛋白质网络的相互关系进行分类学习,从而得到蛋白质的相关性质。这不仅有利于理解蛋白质的特性,而且对生物制药,农林科技等领域同样具有指导意义。
然而,现如今数据以几何速度增长,数据中存在着大量未标记的节点,采用有监督学习较为困难。早期利用专家的先验知识进行人工数据标记,但标记大量数据的代价较大,并且费时费力,因此学者们提出了半监督学习。不同于监督学习和无监督学习,半监督学习在保证模型良好的泛化能力的基础上解决了标记数据大量缺少的问题,同时提升了人工标记的效率和模型学习性能。如何利用现有的半监督分类学习模型对图网络中的未标记节点进行分类预测成为热点话题。随着深度学习的快速发展,图卷积网络成为处理图上不规则结构数据的有力工具,在节点分类等图表示学习任务上取得了令人满意的效果。
本文通过对已有的图卷积网络算法和半监督学习算法进行分析发现,在半监督图卷积网络中,图结构用于指导图卷积运算。在图结构不准确甚至是不可用的情况下,可以从数据中推断或学习图结构用于指导后续的卷积操作。但是现有的研究常基于简单距离度量来构造图结构(例如k-近邻图),简单的图结构不一定能充分挖掘节点之间的相似关系导致节点分类任务性能较差。因此,本文将针对现有图卷积网络模型在图结构上存在的问题,基于自适应图学习,低秩学习、稀疏学习和多视图学习提出两种生成高质量图结构的方法,并用于图卷积网络作半监督分类。主要内容如下:
(1)基于超图的半监督学习图卷积网络。现有的图卷积网络大多忽略图结构的质量,从而导致分类性能不理想。针对这个问题,本文提出一种新的图学习方法来输出高质量的图结构。首先,采用自适应图学习获取数据内在的低层相关性,并从超图中学习更有价值的高层相关性。然后,将稀疏学习和低秩约束分别与图学习相结合,去除冗余信息。最后得到一个紧凑的图结构以促进图卷积网络的信息聚合。实验结果表明,本文提出的图学习方法能够显著提高图卷积网络的半监督分类性能。
(2)基于多视图学习的图卷积网络半监督分类。一般情况下,图卷积网络仅利用单一视图来指导图卷积运算,但单视图只考虑视图内的结构信息,而没有充分利用到不同视图间的相关信息。针对这个问题,本文提出一种基于多视图学习的图卷积网络半监督分类方法。首先,采用多视图学习,同时结合低秩约束降低数据的冗余信息带来的影响,从多视图数据中学习一个共享的高质量图结构,最后将该图结构输入到图卷积网络作半监督分类。实验结果表明,本文提出的多视图学习方法在图卷积网络的半监督分类任务上优于其它对比方法。
针对现有的图卷积网络大多忽略图结构质量这个问题,本文对图学习方法进行了改进,并将半监督分类算法作为实验的评估途径。实验结果表明本文提出的图学习方法在图卷积网络的半监督分类性能上优于选取的对比方法。在未来的工作中,将考虑探索如何动态地进行图学习,同时将图卷积集成到一个统一的框架中进行学习,从而获得更优的图结构。此外,还将探索不同多图融合的方法对半监督图卷积网络模型中图结构质量的影响。
然而,现如今数据以几何速度增长,数据中存在着大量未标记的节点,采用有监督学习较为困难。早期利用专家的先验知识进行人工数据标记,但标记大量数据的代价较大,并且费时费力,因此学者们提出了半监督学习。不同于监督学习和无监督学习,半监督学习在保证模型良好的泛化能力的基础上解决了标记数据大量缺少的问题,同时提升了人工标记的效率和模型学习性能。如何利用现有的半监督分类学习模型对图网络中的未标记节点进行分类预测成为热点话题。随着深度学习的快速发展,图卷积网络成为处理图上不规则结构数据的有力工具,在节点分类等图表示学习任务上取得了令人满意的效果。
本文通过对已有的图卷积网络算法和半监督学习算法进行分析发现,在半监督图卷积网络中,图结构用于指导图卷积运算。在图结构不准确甚至是不可用的情况下,可以从数据中推断或学习图结构用于指导后续的卷积操作。但是现有的研究常基于简单距离度量来构造图结构(例如k-近邻图),简单的图结构不一定能充分挖掘节点之间的相似关系导致节点分类任务性能较差。因此,本文将针对现有图卷积网络模型在图结构上存在的问题,基于自适应图学习,低秩学习、稀疏学习和多视图学习提出两种生成高质量图结构的方法,并用于图卷积网络作半监督分类。主要内容如下:
(1)基于超图的半监督学习图卷积网络。现有的图卷积网络大多忽略图结构的质量,从而导致分类性能不理想。针对这个问题,本文提出一种新的图学习方法来输出高质量的图结构。首先,采用自适应图学习获取数据内在的低层相关性,并从超图中学习更有价值的高层相关性。然后,将稀疏学习和低秩约束分别与图学习相结合,去除冗余信息。最后得到一个紧凑的图结构以促进图卷积网络的信息聚合。实验结果表明,本文提出的图学习方法能够显著提高图卷积网络的半监督分类性能。
(2)基于多视图学习的图卷积网络半监督分类。一般情况下,图卷积网络仅利用单一视图来指导图卷积运算,但单视图只考虑视图内的结构信息,而没有充分利用到不同视图间的相关信息。针对这个问题,本文提出一种基于多视图学习的图卷积网络半监督分类方法。首先,采用多视图学习,同时结合低秩约束降低数据的冗余信息带来的影响,从多视图数据中学习一个共享的高质量图结构,最后将该图结构输入到图卷积网络作半监督分类。实验结果表明,本文提出的多视图学习方法在图卷积网络的半监督分类任务上优于其它对比方法。
针对现有的图卷积网络大多忽略图结构质量这个问题,本文对图学习方法进行了改进,并将半监督分类算法作为实验的评估途径。实验结果表明本文提出的图学习方法在图卷积网络的半监督分类性能上优于选取的对比方法。在未来的工作中,将考虑探索如何动态地进行图学习,同时将图卷积集成到一个统一的框架中进行学习,从而获得更优的图结构。此外,还将探索不同多图融合的方法对半监督图卷积网络模型中图结构质量的影响。