基于信息融合的富信息网络表示学习研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:tanscuc2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络是一种常见的用于描述实体关系的数据形式,许多真实数据都可以用网络的形式表示,例如社交网络,生物信息网络,电力网络等。分析和挖掘网络数据可以帮助理解实体之间的潜在关系和规律,并在人类生活和生产环境中发挥积极作用。传统的网络数据通常以邻接矩阵的形式表示,随着数据量的增大,真实的邻接矩阵往往是高维稀疏的。这对下游应用场景将带来计算复杂度高以及难以端到端融合的困难。为了解决这个问题,网络表示学习在最近几年被提出并得到了广泛的研究。
  网络表示学习的目的是将网络中节点嵌入到低维向量空间中,使得原始网络中接近的节点在低维向量空间中也接近。传统的网络表示学习主要研究的是简单的拓扑结构网络,即网络中只有节点以及边。随着信息搜集能力的增强,实际场景中网络数据呈现出明显的富信息趋势,包含除拓扑结构以外信息的网络通常称为富信息网络。富信息网络的丰富性主要有如下的几个趋势:节点信息丰富、边信息丰富和网络结构丰富。这些富信息为网络表示学习带来了机遇,提供了新的节点邻近度度量方法,并可以帮助解决拓扑网络面临的新节点难以训练以及网络稀疏性问题。富信息同时为网络表示学习带来了两大主要挑战:富信息网络中节点邻近性度量困难和富信息网络中多种信息融合困难。
  为了解决以上的技术难题,本文研究了三大类主流的富信息网络表示学习中的具体问题,包括:(1)如何在带属性网络中融合网络拓扑结构与节点属性?(2)如何在有向网络表示学习中捕获非对称邻近关系和层次结构?(3)如何在异构信息网络表示中同时保留节点的局部和全局个性化偏好?
  1.为了解决问题(1),本文首先提出了一种基于个性化关系排序的带属性网络表示学习方法PRRE。该方法的主要动机是在多个真实数据集上的验证实验结果表明,两种信息源在描述节点之间的关系时存在一定的差异性。为了更准确地刻画两种信息在描述节点之间关系时的差异性,本文将带属性网络中的节点关系分为正关系,模糊关系和负关系,通过一个动态更新的阈值,将任意节点之间的关系分配到对应的关系类型中。通过拟合节点对之间的个性化关系排序,节点的属性和网络拓扑结构之间的差异性被保留到了低维向量空间中。
  2.为了进一步挖掘问题(1)产生的原因,本文同时提出了一种基于相关性和独立性的带属性网络表示学习方法DGE。该方法将带属性网络中节点属性与网络拓扑结构之间的关系分为相关性和独立性,并且提出了一种基于深度生成模型的带属性网络表示学习框架。该框架建模了网络结构和节点属性的生成过程,通过共享生成过程的先验参数来捕获两种信息的相关性,通过两个独立的生成过程来捕获两种信息的独立性,并且将相关性和独立性进行了量化。通过捕获这种相关性和独立性,学习到的节点的向量表示可以更完整地捕获原始网络中的信息。
  3.为了解决问题(2),本文提出了一种基于富信息随机游走的有向网络表示学习方法InfoWalk。该方法着重解决现有方法无法捕获有向网络中的层次结构和非对称关系的缺陷,并且提出了一种基于富信息随机游走的有向网络表示方法InfoWalk。这种随机游走策略通过忽略边的方向来克服悬挂节点带来的随机游走提前终止的问题,并且通过权值记录网络中的层次结构信息。通过对有向网络中节点之间的关系进行定性和定量的度量,使得学习到的节点的低维向量表示可以充分反映输入网络的信息。
  4.为了解决问题(3),本文提出了一种基于层次注意力机制的异构信息网络表示学习方法HAHE。该方法着重捕获异构信息网络中的两种重要特性,不同节点对元路径类型的个性化偏好,不同节点在元路径对应的语义空间中对不同邻居节点的个性化偏好。而这两种特性在先前的工作中没有被完整地捕获,受到深度学习中注意力机制的启发,该方法提出了一种层次注意力框架,从而在少量标签数据的情况下自动学习节点对元路径类型以及元路径对应的语义空间中邻居节点的个性化偏好。
  本文按照网络富信息的类型,从节点富信息,边富信息到网络结构富信息,从信息融合的角度对这些富信息网络表示学习问题进行了研究,取得了出色的研究成果,很好地补充与完善了当前富信息网络表示学习方向的研究。
其他文献
随着信息技术的快速发展,人们对信息的获取和处理逐渐从单一模态转换成多种模态。近年来,人工智能在传统的计算机视觉和自然语言处理等单模态任务上取得了很多激动人心的进展,但是目前的机器智能离通用人工智能仍有很长的路要走。为了理解多模态相互交融的真实环境,人工智能需要同时处理声音、文字和图像等多模态数据,实现多种模态信息的融合和互补。然而,数据的多模态性使得数据表征、信息检索、知识发现和语义推理等应用面临
学位
图是计算机解决问题时采用的一种重要数据结构,它广泛应用于各种场景,在真实世界、社会关系和网络空间中随处可见。一方面,随着互联网的普及以及传感器和通信技术的进步,越来越多的数据以图的形式呈现出来;另一方面,人们越来越关注由对象与对象之间的关联性产生的复杂结构,而图正是研究和利用这些结构信息的重要工具。在这样的背景下,作为图中结构和语义信息的载体,图节点属性可扮演标签或特征的角色,赋能面向图的机器学习
知识图谱是一种简单有效的存储知识的方式,近年来许多开放域和垂直域的大型知识图谱被构建起来并得到了广泛的应用。知识表示和推理是人工智能研究中的重要课题,随着大数据时代的到来和计算能力的提升,原本符号化的知识表示和推理在逐渐向向量空间迁移,可以通过将知识元素映射到低维的向量空间中并基于向量空间的计算完成推理,这种基于向量空间计算的推理称为可微的推理,本文围绕可微的知识图谱推理及其应用展开研究。  可微
学位
行为识别的目的在于确定序列行为数据中任意时刻的行为模式,在智能感知、医疗健康、生物神经解码和人机交互等领域具有广泛应用价值。随着传感器及物联网等技术的发展、普及,行为数据体量越来越大、类别逐渐丰富、分布特性日益复杂,在有限成本内获得的人工标注数据相对于数据整体而言则越来越稀少、单一,因而基于经典监督学习的行为识别模型越来越容易过拟合。同时,随着传感技术的快速迭代更新和行为个体及应用需求的不断改变,
学位
使用有限元分析进行产品优化设计常常是一个多次迭代的过程,而且每一次迭代一般都需要重新进行十分耗时的有限元网格划分,以支持再分析,从而大大降低了产品再分析和优化设计的效率。为了显著提高产品优化设计和变动设计过程中再分析的效率,一种有效的解决方案是通过局部网格编辑而不是进行网格重生成,实现所需要的网格变动。然而,由于现有的少量六面体网格编辑方法仅能对六面体网格进行简单编辑,实现小幅变动,并且难以保证编
随着移动互联网通讯带宽增加和智能手机移动处理能力的增强,视频的创作与传播变得越来越方便,越来越多的视频被用户创作产生。为了有效利用海量视频资源,对其蕴含的丰富语义进行理解且检索是一个很有意义的研究内容。  传统的视频理解模型往往从预先定义的类别标签出发,基于属于该类别标签视频中的内容要素训练模板,进而完成语义识别任务。这种方式存在一定程度的局限性。对于预先定义类别标签中没有覆盖到的内容要素,该方法
建筑物外立面的语法解析与语义重建是计算机视觉中重要的问题之一。在地图重建、计算机辅助设计、电影与游戏的大规模城市生成中,这项技术有着重要的应用。高效而准确的建筑物解析系统可以节省大量的手工劳动力,实现高效的城市解析,进而通过语义重建系统,可以快速灵活地重建、生成大规模的三维城市模型。建筑物外立面的解析仍然是一个具有挑战性的难题,这是由建筑物外立面较为复杂的纹理结构、光照变化和遮挡等其他因素造成的。
随着硬件设备的发展,网络服务的普及以及社交媒体的兴起,每天都有海量视频数据被源源不断地生产出来,如何从这些视频中提取有价值的信息成为一个亟待解决的问题。作为一种新兴技术手段,视频问答能够基于问题针对性地提供视频中包含的各类物体和动作等诸多相关信息,其不仅可以提升信息提取的效率,而且拥有广泛的应用场景。视频问答主要涉及到文本信息理解,视频信息理解以及两者之间的交互,其中文本信息理解的算法发展较为成熟
学位
作为计算机视觉的基础核心研究问题之一,目标跟踪算法旨在对连续视频序列中的给定物体目标进行自动化跟踪并标注其对应的位置状态。在无人车驾驶、视频监控、视频编辑、机器人视觉等领域中,目标跟踪算法都扮演着至关重要的角色。一直以来,研究者们从不同角度出发提出了各种算法用以解决一系列问题,其中包括环境复杂问题、光照变化问题、遮挡问题以及物体变形问题等等。近年来,通过协滤波器、深度学习特征提取和孪生网络等技术的
随着信息网络技术的不断进步,近年来人们已经能够在丰富的场景中见到各式各样的物联网产品,比如工业物联网和家居物联网产品等。据国际知名科技咨询机构Gartner预测,到2025年,全球物联网设备的连接数将达到416亿。不同的物联网设备因其不同的通信需求,使用了不同的无线协议。此时,不同的无线协议将同时运行,这被称为无线跨协议的场景。这些同时运行的无线协议,如果运行的载波频率一致,且未被进行合理的协同时