论文部分内容阅读
现实世界中,各种各样的复杂系统,例如社交网络、计算机网络、化学分子网络、蛋白质交互网络、引文网络等都能高度抽象成图的形式。图表示学习旨在为图中的每个节点或整个图学习一个低维、稠密、实值的向量表示,从而便于后续的网络分析任务,例如节点分类、链接预测、节点可视化、图分类、社区发现、影响力最大化等。传统的图表示学习方法面临着计算效率和存储效率的问题,且图数据的复杂性给传统的机器学习算法带来了重大的挑战。深度神经网络受启发于人脑神经元及其连接结构,具有数据驱动、特征表示能力强、高效建模等特点,因此适合于学习图表示。本博士论文针对图表示学习面临的挑战与现有相关工作的不足,通过保存节点相似性、图拓扑结构,设计多视图图注意力网络、多任务图表示学习架构、半监督图神经网络模型来学习高质量的图特征表示,并用于相关的复杂网络分析任务。主要研究内容包括以下五个部分:
(1)大多数现存的网络嵌入算法主要捕获了节点的局部成对近邻或隐式地刻画了邻居相似性,不足以捕获丰富的节点相似性。针对该问题,提出了一个新的基于深度自编码网络的网络嵌入算法,来建模更全面的节点相似性,包括节点间的邻接相似性、可达相似性和邻居相似性。在标准网络数据集上的实验表明,提出的方法学到了有效的节点表示,能够在节点分类、链接预测、节点可视化和节点聚类任务上优于经典的对比算法。
(2)网络嵌入旨在把节点映射到低维特征空间中的同时尽可能保存网络中节点间的拓扑关联。现存的网络嵌入工作聚焦在保存局部拓扑或有限步长内的全局拓扑信息,而且限定了潜在的网络是无向无权图。为了更好地对网络中的复杂和丰富拓扑关联进行建模,提出了一种基于深度降噪自编码网络的网络嵌入算法,首先设计了贴近度矩阵来捕获网络全局拓扑,然后通过优化全局近邻重构和局部邻居保存损失来学习低维的节点表示,且该算法能适用于有(无)向、有(无)权信息网络。实验表明,该方法在节点分类、链接预测和节点可视化任务上取得了显著的效果。
(3)现实复杂系统中的实体间通常存在多种类型的关联,即表现为多层网络。多视图网络嵌入使用每个视图来刻画节点间的一层关系,旨在学习低维节点表示的同时捕获多层网络中的多种连接关系。我们设计了一种多视图图注意力网络,利用基于注意力的架构从每个视图学习节点表示,且多个视图的神经网络参数通过一个正则化项约束。为了有效集成不同视图中的多种类型关联,提出了一个聚焦视图的注意力方法,用于聚合不同视图学到的节点表示。最后在多个现实数据集上证明了该方法具有较好的性能。
(4)目前已有的基于图神经网络的图分类算法通过聚合节点表示来学到图表示,且都遵循一个单任务学习架构,缺乏有效利用节点的标签信息。针对此问题,提出了一个多任务图表示学习架构,通过联合优化节点分类损失和图分类损失,来端到端地学习到判别能力强的图表示,从而提升图分类性能。实验结果表明,与单任务图神经网络方法相比,提出的架构充分利用了节点标签,在多个数据集上显著提升了图分类的效果。
(5)由于图数据标记的高度复杂性,现实场景中的图分类通常缺乏足够多的标记数据。现有的半监督图神经网络聚焦在节点分类且很难直接用到图分类。为了应对该挑战,提出了一个用于图分类的半监督图神经网络框架。基于少量的标记图和大量的无标记图,同时训练两个图神经网络作为互补的视图,来协同学习高质量的图分类器。为了进一步提高视图本身的性能,不断从自己视图中选取高置信度的图样例来扩大标记图数据集,从而增强图分类。最后将该框架扩展到了小样本图分类,据我们所知,这是首次研究具有挑战性的小样本图分类问题。大量的实验结果显示了该框架的有效性。
(1)大多数现存的网络嵌入算法主要捕获了节点的局部成对近邻或隐式地刻画了邻居相似性,不足以捕获丰富的节点相似性。针对该问题,提出了一个新的基于深度自编码网络的网络嵌入算法,来建模更全面的节点相似性,包括节点间的邻接相似性、可达相似性和邻居相似性。在标准网络数据集上的实验表明,提出的方法学到了有效的节点表示,能够在节点分类、链接预测、节点可视化和节点聚类任务上优于经典的对比算法。
(2)网络嵌入旨在把节点映射到低维特征空间中的同时尽可能保存网络中节点间的拓扑关联。现存的网络嵌入工作聚焦在保存局部拓扑或有限步长内的全局拓扑信息,而且限定了潜在的网络是无向无权图。为了更好地对网络中的复杂和丰富拓扑关联进行建模,提出了一种基于深度降噪自编码网络的网络嵌入算法,首先设计了贴近度矩阵来捕获网络全局拓扑,然后通过优化全局近邻重构和局部邻居保存损失来学习低维的节点表示,且该算法能适用于有(无)向、有(无)权信息网络。实验表明,该方法在节点分类、链接预测和节点可视化任务上取得了显著的效果。
(3)现实复杂系统中的实体间通常存在多种类型的关联,即表现为多层网络。多视图网络嵌入使用每个视图来刻画节点间的一层关系,旨在学习低维节点表示的同时捕获多层网络中的多种连接关系。我们设计了一种多视图图注意力网络,利用基于注意力的架构从每个视图学习节点表示,且多个视图的神经网络参数通过一个正则化项约束。为了有效集成不同视图中的多种类型关联,提出了一个聚焦视图的注意力方法,用于聚合不同视图学到的节点表示。最后在多个现实数据集上证明了该方法具有较好的性能。
(4)目前已有的基于图神经网络的图分类算法通过聚合节点表示来学到图表示,且都遵循一个单任务学习架构,缺乏有效利用节点的标签信息。针对此问题,提出了一个多任务图表示学习架构,通过联合优化节点分类损失和图分类损失,来端到端地学习到判别能力强的图表示,从而提升图分类性能。实验结果表明,与单任务图神经网络方法相比,提出的架构充分利用了节点标签,在多个数据集上显著提升了图分类的效果。
(5)由于图数据标记的高度复杂性,现实场景中的图分类通常缺乏足够多的标记数据。现有的半监督图神经网络聚焦在节点分类且很难直接用到图分类。为了应对该挑战,提出了一个用于图分类的半监督图神经网络框架。基于少量的标记图和大量的无标记图,同时训练两个图神经网络作为互补的视图,来协同学习高质量的图分类器。为了进一步提高视图本身的性能,不断从自己视图中选取高置信度的图样例来扩大标记图数据集,从而增强图分类。最后将该框架扩展到了小样本图分类,据我们所知,这是首次研究具有挑战性的小样本图分类问题。大量的实验结果显示了该框架的有效性。