在线社会关系网络中消息流行度预测研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:astanaZH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,社交网站和社会媒体等在线社会关系网络逐渐成为互联网服务和应用的主流。人人参与信息的产生、传播和获取,人们信息传播和信息共享的诉求得到了极大程度地满足,获得了前所未有的信息自主权,人的互联和信息互联高度融合。同时,在线社会关系网络的快速发展带来了信息产生社会化、信息内容碎片化和信息传播网络化等问题,给网络空间的科学管理和有效利用带来了新的挑战。因此,深入分析在线社会关系网络、揭示网络信息传播的基本模式和内在规律、预测消息的未来传播态势,具有重要的学术意义和广泛的应用前景。同时,在线社会关系网络汇聚了大量可感知、可计算的网络数据,这些人类活动的真实记录为研究在线社会关系网络及其上的信息传播提供了宝贵的数据资源和难得的机遇。  本文中,我们以新浪微博为主要研究场景,从三个方面展开研究了在线社会关系网络中消息流行度预测问题,分别是信息传播中的累积效应、基于早期传播历史的消息流行度预测以及流行度动态过程中的时间尺度非均匀性。  在信息传播中的累积效应研究问题中,我们围绕信息传播中的多次暴露现象展开研究。首先,我们根据消息的传播轨迹构建其扩散树,并对消息扩散树的宏观统计特征以及传播时序特征进行了实证研究,相关结论对于我们直观认识和深入理解信息传播及其内在规律具有重要作用。然后,我们结合信息传播底层的关注关系网络,从更加微观的角度研究了真实信息传播中的多次暴露现象,并深入挖掘了该复杂现象对于用户转发行为所带来的累积效应。最后,我们提出了信息传播中用户在多个消息暴露源下的转发选择预测问题,并融合消息内容、暴露源结构、时序和历史信息等方面因素,建模和预测了个体的转发选择行为。  在消息流行度预测算法研究问题中,我们基于消息早期的传播历史,预测消息的最终流行度及其动态过程。我们实证发现消息早期传播者之间的连边密度和扩散深度与消息最终流行度之间存在强相关性,提出了融合结构多样性的消息流行度预测算法。实验结果表明,我们的算法相对于消息流行度预测的基准算法在预测性能上有显著提升。接下来,我们建模和预测了消息流行度的动态过程,我们仅利用了消息早期传播过程中每个转发者的时间戳信息,采用自激励霍克斯过程建模消息每一次的转发到达过程,从而很好地刻画了消息流行度的动态过程。实验结果表明,我们的模型相对于消息流行度动态过程基准方法有更高的预测性能。  在流行度动态过程的时间尺度研究问题中,我们研究了人类行为的时间尺度非均匀性对流行度预测的影响。首先,我们对消息流行度的动态过程和系统活跃度进行了实证研究,发现影响消息流行度动态过程的因素错综复杂,流行度的动态过程难以预测,但同时也具有时序上的多峰模式和昼夜节律。然后,我们发现人类行为时间尺度的非均匀性与流行度动态过程之间的一致性关系,通过一种全局时间尺度变换方法,对所有消息流行度动态过程进行了重新描述,发现了流行度动态过程中的普遍时序规律。最后,我们利用所提出的时间尺度变换方法,可以提高当前已有在线社会关系网络中消息流行度预测模型的性能。该研究成果对于我们深刻理解信息传播、流行度动态过程及其与人类行为动力学之间的关系具有非常重要的意义。  综上所述,本文的研究分别从信息传播的微观机理、预测算法和时序模式三个层面研究了在线社会关系网络中消息流行度预测问题,推动了消息流行度预测的理论研究和产业应用。目前相关的研究还处于兴起阶段,还有许多的问题值得进一步探索和挖掘。
其他文献
本文以武汉中地公司开发的数字测图系统MapSuv的输出文件.suv作为数据源,研究了基于二维矢量地图的三维可视化方法,并在此基础上,开发了数字测图成果的三维可视化系统.论文的
随着Internet技术的不断发展,基于Web方式的论坛得到了越来越广泛的应用,随着时间的推移,这些论坛站点中积累了丰富的信息资源。然而,由于论坛站点本身的特点,至今缺乏行之有效的
随着科学技术的进步,对测量技术的要求越来越高.电子测量技术在各个领域得到越来越广泛的应用,传统的电子测量仪器由于其功能单一,体积庞大,已经很难满足实际工作的需要.集成
掌纹在线识别是利用人的手掌掌纹图像对其身份进行认证的一种生物特征识别技术.掌纹识别作为生物识别技术的一个重要分支,具有采样简单、信息丰富的特点,是一个值得深入研究
随着计算机网络和通信技术的飞速发展,数字媒体(包括数字图像、数字视频、数字音频)已得到了广泛的应用,随之而来的数字媒体的信息安全、知识产权保护和认证等问题也变得日益突出
计算机网络的出现使世界的联系变得更加紧密。但是,开放式网络上和分布式系统上不断增长的各种应用尤其是电子商务的蓬勃发展,对系统的安全提出了巨大挑战,不能有效地解决计算机
软件复用是解决软件危机、实现软件产业工业化生产方式的有效途径.软件复用活动包含两个相关的阶段:可复用软件资产的生产阶段和基于可复用软件资产的应用系统开发阶段.领域
网络服务是当前最引人关注的计算机技术之一.随着网络服务需求的不断增长,选择好的网络服务显得越来越重要.服务选择是指调用者在拥有相同接口的多个网络服务中做出合适选择
信息社会的发展、网络及计算机技术的进一步普及,使得对网络上提供高质量的视频/音频等多媒体服务的需求越来越大。视频会议技术就是一种让身处异地的人们通过某种传输介质实
地理信息产业是信息产业的一个重要组成部分,地理信息技术是IT技术的一个重要分支,地理信息系统软件是一类特殊的计算机信息系统软件,它是以各类空间数据及其属性为基础,为各种应