论文部分内容阅读
网络是一种常见的用于描述实体关系的数据形式,许多真实数据都可以用网络的形式表示,例如社交网络,生物信息网络,电力网络等。分析和挖掘网络数据可以帮助理解实体之间的潜在关系和规律,并在人类生活和生产环境中发挥积极作用。传统的网络数据通常以邻接矩阵的形式表示,随着数据量的增大,真实的邻接矩阵往往是高维稀疏的。这对下游应用场景将带来计算复杂度高以及难以端到端融合的困难。为了解决这个问题,网络表示学习在最近几年被提出并得到了广泛的研究。
网络表示学习的目的是将网络中节点嵌入到低维向量空间中,使得原始网络中接近的节点在低维向量空间中也接近。传统的网络表示学习主要研究的是简单的拓扑结构网络,即网络中只有节点以及边。随着信息搜集能力的增强,实际场景中网络数据呈现出明显的富信息趋势,包含除拓扑结构以外信息的网络通常称为富信息网络。富信息网络的丰富性主要有如下的几个趋势:节点信息丰富、边信息丰富和网络结构丰富。这些富信息为网络表示学习带来了机遇,提供了新的节点邻近度度量方法,并可以帮助解决拓扑网络面临的新节点难以训练以及网络稀疏性问题。富信息同时为网络表示学习带来了两大主要挑战:富信息网络中节点邻近性度量困难和富信息网络中多种信息融合困难。
为了解决以上的技术难题,本文研究了三大类主流的富信息网络表示学习中的具体问题,包括:(1)如何在带属性网络中融合网络拓扑结构与节点属性?(2)如何在有向网络表示学习中捕获非对称邻近关系和层次结构?(3)如何在异构信息网络表示中同时保留节点的局部和全局个性化偏好?
1.为了解决问题(1),本文首先提出了一种基于个性化关系排序的带属性网络表示学习方法PRRE。该方法的主要动机是在多个真实数据集上的验证实验结果表明,两种信息源在描述节点之间的关系时存在一定的差异性。为了更准确地刻画两种信息在描述节点之间关系时的差异性,本文将带属性网络中的节点关系分为正关系,模糊关系和负关系,通过一个动态更新的阈值,将任意节点之间的关系分配到对应的关系类型中。通过拟合节点对之间的个性化关系排序,节点的属性和网络拓扑结构之间的差异性被保留到了低维向量空间中。
2.为了进一步挖掘问题(1)产生的原因,本文同时提出了一种基于相关性和独立性的带属性网络表示学习方法DGE。该方法将带属性网络中节点属性与网络拓扑结构之间的关系分为相关性和独立性,并且提出了一种基于深度生成模型的带属性网络表示学习框架。该框架建模了网络结构和节点属性的生成过程,通过共享生成过程的先验参数来捕获两种信息的相关性,通过两个独立的生成过程来捕获两种信息的独立性,并且将相关性和独立性进行了量化。通过捕获这种相关性和独立性,学习到的节点的向量表示可以更完整地捕获原始网络中的信息。
3.为了解决问题(2),本文提出了一种基于富信息随机游走的有向网络表示学习方法InfoWalk。该方法着重解决现有方法无法捕获有向网络中的层次结构和非对称关系的缺陷,并且提出了一种基于富信息随机游走的有向网络表示方法InfoWalk。这种随机游走策略通过忽略边的方向来克服悬挂节点带来的随机游走提前终止的问题,并且通过权值记录网络中的层次结构信息。通过对有向网络中节点之间的关系进行定性和定量的度量,使得学习到的节点的低维向量表示可以充分反映输入网络的信息。
4.为了解决问题(3),本文提出了一种基于层次注意力机制的异构信息网络表示学习方法HAHE。该方法着重捕获异构信息网络中的两种重要特性,不同节点对元路径类型的个性化偏好,不同节点在元路径对应的语义空间中对不同邻居节点的个性化偏好。而这两种特性在先前的工作中没有被完整地捕获,受到深度学习中注意力机制的启发,该方法提出了一种层次注意力框架,从而在少量标签数据的情况下自动学习节点对元路径类型以及元路径对应的语义空间中邻居节点的个性化偏好。
本文按照网络富信息的类型,从节点富信息,边富信息到网络结构富信息,从信息融合的角度对这些富信息网络表示学习问题进行了研究,取得了出色的研究成果,很好地补充与完善了当前富信息网络表示学习方向的研究。
网络表示学习的目的是将网络中节点嵌入到低维向量空间中,使得原始网络中接近的节点在低维向量空间中也接近。传统的网络表示学习主要研究的是简单的拓扑结构网络,即网络中只有节点以及边。随着信息搜集能力的增强,实际场景中网络数据呈现出明显的富信息趋势,包含除拓扑结构以外信息的网络通常称为富信息网络。富信息网络的丰富性主要有如下的几个趋势:节点信息丰富、边信息丰富和网络结构丰富。这些富信息为网络表示学习带来了机遇,提供了新的节点邻近度度量方法,并可以帮助解决拓扑网络面临的新节点难以训练以及网络稀疏性问题。富信息同时为网络表示学习带来了两大主要挑战:富信息网络中节点邻近性度量困难和富信息网络中多种信息融合困难。
为了解决以上的技术难题,本文研究了三大类主流的富信息网络表示学习中的具体问题,包括:(1)如何在带属性网络中融合网络拓扑结构与节点属性?(2)如何在有向网络表示学习中捕获非对称邻近关系和层次结构?(3)如何在异构信息网络表示中同时保留节点的局部和全局个性化偏好?
1.为了解决问题(1),本文首先提出了一种基于个性化关系排序的带属性网络表示学习方法PRRE。该方法的主要动机是在多个真实数据集上的验证实验结果表明,两种信息源在描述节点之间的关系时存在一定的差异性。为了更准确地刻画两种信息在描述节点之间关系时的差异性,本文将带属性网络中的节点关系分为正关系,模糊关系和负关系,通过一个动态更新的阈值,将任意节点之间的关系分配到对应的关系类型中。通过拟合节点对之间的个性化关系排序,节点的属性和网络拓扑结构之间的差异性被保留到了低维向量空间中。
2.为了进一步挖掘问题(1)产生的原因,本文同时提出了一种基于相关性和独立性的带属性网络表示学习方法DGE。该方法将带属性网络中节点属性与网络拓扑结构之间的关系分为相关性和独立性,并且提出了一种基于深度生成模型的带属性网络表示学习框架。该框架建模了网络结构和节点属性的生成过程,通过共享生成过程的先验参数来捕获两种信息的相关性,通过两个独立的生成过程来捕获两种信息的独立性,并且将相关性和独立性进行了量化。通过捕获这种相关性和独立性,学习到的节点的向量表示可以更完整地捕获原始网络中的信息。
3.为了解决问题(2),本文提出了一种基于富信息随机游走的有向网络表示学习方法InfoWalk。该方法着重解决现有方法无法捕获有向网络中的层次结构和非对称关系的缺陷,并且提出了一种基于富信息随机游走的有向网络表示方法InfoWalk。这种随机游走策略通过忽略边的方向来克服悬挂节点带来的随机游走提前终止的问题,并且通过权值记录网络中的层次结构信息。通过对有向网络中节点之间的关系进行定性和定量的度量,使得学习到的节点的低维向量表示可以充分反映输入网络的信息。
4.为了解决问题(3),本文提出了一种基于层次注意力机制的异构信息网络表示学习方法HAHE。该方法着重捕获异构信息网络中的两种重要特性,不同节点对元路径类型的个性化偏好,不同节点在元路径对应的语义空间中对不同邻居节点的个性化偏好。而这两种特性在先前的工作中没有被完整地捕获,受到深度学习中注意力机制的启发,该方法提出了一种层次注意力框架,从而在少量标签数据的情况下自动学习节点对元路径类型以及元路径对应的语义空间中邻居节点的个性化偏好。
本文按照网络富信息的类型,从节点富信息,边富信息到网络结构富信息,从信息融合的角度对这些富信息网络表示学习问题进行了研究,取得了出色的研究成果,很好地补充与完善了当前富信息网络表示学习方向的研究。