基于图卷积的社交网络信息级联预测研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:gameboy13888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的崛起,推文的爆炸式转发分享所引发的社会轰动已屡见不鲜。转发分享所引起的现象又称为信息级联现象,信息的级联传播形成不可估量的社会合力,并对社会造成深刻的影响。在此背景下,通过研究信息的传播过程,对信息级联进行预测,具有重要的理论意义和现实价值。本文在查阅大量国内外相关文献的基础上,综合运用生成建模、深度学习方法,通过对信息传播过程进行合理编码,构建了社交网络中的信息级联预测模型,并对模型进行实证分析。本文主要工作内容和创新点如下:
  1)提出了一种基于时空注意力的社交网络信息级联预测模型。为捕获信息在传播过程中的用户交互行为间的依赖关系,本文通过显式地学习级联信息中时序信息和空间结构信息的表示特征,提出了基于时空注意力的社交网络信息级联预测(ICP)模型。为获得级联信息的空间结构信息,利用图卷积网络学习传播级联图的表示特征,将其邻居节点的特征汇聚到自身节点,利用双向循环神经网络学习级联子图中节点间的时序信息以及相互作用,再结合注意力机制耦合计算过程中的空间结构信息与时序信息。最后,在两个真实的级联数据集上的验证,实验结果证明了ICP模型各部分的必要性和各变体的高效性。相比之前的级联预测模型,该模型预测误差显著地降低,且在不同预测场景均具有良好的通用性。
  2)提出了一种自激励点过程的图卷积级联预测模型。本文考虑信息传播的点过程,利用图卷积网络、随机游走、自激励机制提出一种自激励点过程的图卷积级联预测(GHawkes)模型。首先,根据邻居节点的特征信息对用户的影响力进行编码,采用随机游走进行采样,再利用图卷积网络对用户影响力进行图表示学习,学习用户之间的关系,再通过自激励过程对级联信息的传播构成进行学习,然后,使用注意力机制耦合用户影响力和自激励过程并通过内容衰减输出预测。最后,在两个真实的级联数据集上的验证,实验结果表明GHawkes各部分的必要性以及各变体的高效性;相比之前的预测模型,该模型预测误差显著地降低,且在不同预测场景均具有良好的通用性。
其他文献
人联网(the Internet of People,IoP)是一种以人为中心的新型实时交互式物联网,它的服务理念聚焦于用户的个性化需求,为个人带来了更丰富的交互体验。近年来,IoP系统在医疗监护和健康领域有着较为广泛的研究。由于系统中包含了大量与用户联系紧密的服务,而这些服务中即使存在一些微小的错误,都可能伤害到用户甚至对其造成生命威胁,所以对IoP系统进行可靠性分析十分重要。然而,IoP系统不
学位
现有的基于神经网络的自然语言处理模型依赖于大量目标域内的标记数据进行训练,然而,为低资源目标域收集足够的训练数据通常是昂贵且耗时的。文本序列的迁移学习方法通过将一些在不同但相关的任务或领域的源域中已经获得的知识直接迁移到感兴趣的目标域来提高目标任务的表现,与单任务方法相比具有直接的优势。虽然迁移学习在文本序列的处理上已取得了不错的进展,但是仍面临一些问题,包括不同领域间“迁移什么”和“如何迁移”。
学位
随着科技的发展,高性能计算机在生产、生活、科技等方面越来越发挥着不可替代的作用。由于高性能硬件体系结构的迅速发展,高性能计算应用软件已无法充分发挥硬件体系结构的优势,因此有必要对高性能计算软件进行优化。基础数学函数库是高性能计算机中必不可少的软件之一,也是编译器至关重要的组成部分,众多领域的高性能计算应用软件都依赖于基础数学函数的计算结果,它的性能直接决定了众多领域的上层应用计算程序的执行效率。为
自“神威·太湖之光”计算机问鼎世界,我国高性能计算机和高性能计算应用蓬勃发展,位居世界前列。在当下国际激烈竞争中,自主可控技术和自主可控的知识产权显得尤为重要,而仅仅自主可控只是一个良好的开端,如何构建具有足够竞争优势的自主可控产业生态链是需要投入大量时间精力,科研开发人员全身心投入科研实践中去,探究摸索,搭建环境,最重要的是结合架构去优化底层库,使之更好的为上层应用服务。基础线性代数子函数库(B
随着互联网更大程度的普及,一方面,在线教育平台蓬勃发展,教育信息化迈入了新的时代,学习者在不同学习平台中产生的海量学习行为数据,能够被学习管理系统所存储记录,利用学习者产生的学习行为数据能够及时有效地对学习者进行学情预警、学习路径推荐、课程推荐等一系列应用;另一方面,计算机技术与其他领域快速融合,计算机科学技术及其应用的影响日益深远,吸引着越来越多教育背景迥异的人们竞相学习相关知识技术,而《计算机
学位
随着国家教育体系的日益完善,越来越多的人可以进入高校接受高等教育。但在众多的高校中,人们以何种方式从大量无序的信息资源中有效地查看各高校相关信息,如何根据自身兴趣选择一所高校,这些问题都会阻碍人们进行科学客观的决策。目前很多领域都借助知识图谱开展了相关的应用研究,在教育领域中构建高校信息知识图谱,以帮助人们高效获取知识颇为重要。使用知识图谱可视化技术,以网络图的形式表达知识,更好地展示出了高校基本
学位
物流业的蓬勃发展致使物流用户隐私数据泄露问题日益严峻,如何有效保护物流用户的隐私数据是需要进一步解决的难题。通过对物流业务流程的研究,总结出物流用户隐私数据泄露的三个原因:1)中转过程中使用的快递单明文存储数据造成大量隐私泄露。2)由物流企业方对用户隐私数据提供安全保障易发生职权混乱导致隐私泄露。3)数据存储服务器不安全易被黑客攻击导致隐私泄露。针对以上问题,本文提出了一种基于区块链的物流隐私数据
大数据为医疗行业发现新价值带来了新的机遇:它可以帮助我们深入了解数据的隐藏价值;与此同时也带来了新的挑战:如何有效的管理和组织这些数据集。在医疗大数据发布、存储、挖掘和使用的整个生命周期过程中,涉及到了不同的用户因此在不同的生命周期都有对应的隐私保护方法和技术。数据的使用是整个生命周期中的最后一环也是最重要的一环,无论是原始数据信息还是从医疗大数据中挖掘出的信息,最终都是通过数据使用一环才能将大数
近年来,工业互联网得到迅速发展,打破了工业控制系统以往物理环境特殊的封闭性,使得全球范围内工控安全事件频繁发生,给企业带来恶劣影响。可编程逻辑控制器(Programmable Logic Controller, PLC)作为控制物理过程的核心设施,一直是网络攻击者主要攻击目标。因此,为检测攻击可在现场跟踪PLC或重要设施的运行状态,检查它们是否处于活性状态——即使用活性证明协议向开放式网络控制中心
网络技术的飞速发展促进了众多社交网络平台的发展,这不仅使得用户能更加方便、灵活地接受和共享信息,也使得谣言在社交网络中的传播更加便捷,极大地促进了谣言传播的范围和速度。如何制定相应策略来有效地控制谣言在社交网络中的传播,对维护社会稳定与安全具有重要意义。在社交网络中,谣言与其他信息并存,影响谣言传播的因素不仅包括谣言自身的特征、传播者的个体因素和群体心理以及网络中的其他并存信息,也包括网络拓扑结构
学位