论文部分内容阅读
近年来,随着互联网技术和在线社交网络的发展,人们可以随时随地创作、浏览、转发、评论各种信息,在个人创作和消费信息的同时提高了信息在时空传播的效率。与广播、电视、报纸等大众传媒相比,在线社交网络从根本上改变了信息传播的方式和机理,逐渐成为信息发布和传播的主流平台。社交网络信息传播的相关研究,不但能够帮助人们认识社交网络本身,解释网络群体行为规律,预测信息传播趋势,而且在公共舆论导控、精准市场营销、信息推荐服务等诸多领域具有广泛应用价值。
在线社交网络信息传播具有数据海量、传播规律多样、时空动态性、非线性等特点。本文以社交网络舆情为应用背景,基于数据驱动研究社交网络信息传播仿真建模的关键技术和方法。本文的主要研究工作和贡献如下:
1.提出了基于平行控制思想的网络舆情仿真框架以及基于数据驱动的网络舆情仿真建模框架。基于数据驱动的网络舆情仿真建模框架是网络舆情仿真框架的核心组成部分,包括模型驱动的社交网络大数据分析,数据驱动的多学科舆情系统建模,以及以舆情主体、舆情事件、舆情网络、舆情导控策略为主要对象的舆情仿真系统建模。
2.基于大规模微信信息级联数据进行研究,得到了微信网络信息级联拓扑结构特征,时空动态特性,传播模式,以及地理因素、信息内容等对信息传播的影响。发现微信信息级联规模服从幂律分布,传播方式混合了广播式传播和病毒式传播,信息传播在时间上体现出周期性和阵发性。发现信息传播概率随地理距离幂律衰减,信息传播概率和速率在地理位置上体现出多样多样性和异质性。
3.提出了基于优先连接随机递归树的级联生长模型RRT和基于用户查看转发行为数据驱动的随机异质信息传播模型SVFR,能够相对有效地描述微信网络的信息传播过程。RRT模型通过单参数刻画了信息级联树平均路径长度和度标准差与级联规模的关系,量化了级联树的相对深度或宽度,并能够表征信息在多大程度上通过广播式或病毒式进行传播。SVFR是通用的一阶异质随机信息传播模型,能够复现信息在微信社交网络的传播过程,并能够在级联规模幂律分布,以及平均路径长度和度标准差与级联规模的关系两个方面很好地刻画信息传播过程。
4.提出了数据驱动连续时间信息传播模型CTSVFR以及地理交互数据驱动的模块化层次化网络模型GIDDGNM,有利于刻画网络信息的时空传播特征。CTSVFR模型不但能够重现微信社交网络信息传播的拓扑特征,而且能够刻画生命周期和相对传播速率两个时间维度的特征。GIDDGNM能够基于部分观测的信息级联数据重构社交网络的层次结构、社团结构以及地理空间特性,在度分布、平均聚类系数、平均路径长度等多个指标上具有良好结果,并且便于大规模应用。
综上所述,本文从仿真建模的角度出发,结合数据建模和机理建模的长处,研究了基于数据驱动的社交网络舆情信息传播仿真建模的关键技术。基于微信信息传播实证数据,验证了从数据挖掘分析到信息时空传播模型构建和仿真的整个流程。本文的研究成果对社交网络舆情研究具有重要理论和应用价值。
在线社交网络信息传播具有数据海量、传播规律多样、时空动态性、非线性等特点。本文以社交网络舆情为应用背景,基于数据驱动研究社交网络信息传播仿真建模的关键技术和方法。本文的主要研究工作和贡献如下:
1.提出了基于平行控制思想的网络舆情仿真框架以及基于数据驱动的网络舆情仿真建模框架。基于数据驱动的网络舆情仿真建模框架是网络舆情仿真框架的核心组成部分,包括模型驱动的社交网络大数据分析,数据驱动的多学科舆情系统建模,以及以舆情主体、舆情事件、舆情网络、舆情导控策略为主要对象的舆情仿真系统建模。
2.基于大规模微信信息级联数据进行研究,得到了微信网络信息级联拓扑结构特征,时空动态特性,传播模式,以及地理因素、信息内容等对信息传播的影响。发现微信信息级联规模服从幂律分布,传播方式混合了广播式传播和病毒式传播,信息传播在时间上体现出周期性和阵发性。发现信息传播概率随地理距离幂律衰减,信息传播概率和速率在地理位置上体现出多样多样性和异质性。
3.提出了基于优先连接随机递归树的级联生长模型RRT和基于用户查看转发行为数据驱动的随机异质信息传播模型SVFR,能够相对有效地描述微信网络的信息传播过程。RRT模型通过单参数刻画了信息级联树平均路径长度和度标准差与级联规模的关系,量化了级联树的相对深度或宽度,并能够表征信息在多大程度上通过广播式或病毒式进行传播。SVFR是通用的一阶异质随机信息传播模型,能够复现信息在微信社交网络的传播过程,并能够在级联规模幂律分布,以及平均路径长度和度标准差与级联规模的关系两个方面很好地刻画信息传播过程。
4.提出了数据驱动连续时间信息传播模型CTSVFR以及地理交互数据驱动的模块化层次化网络模型GIDDGNM,有利于刻画网络信息的时空传播特征。CTSVFR模型不但能够重现微信社交网络信息传播的拓扑特征,而且能够刻画生命周期和相对传播速率两个时间维度的特征。GIDDGNM能够基于部分观测的信息级联数据重构社交网络的层次结构、社团结构以及地理空间特性,在度分布、平均聚类系数、平均路径长度等多个指标上具有良好结果,并且便于大规模应用。
综上所述,本文从仿真建模的角度出发,结合数据建模和机理建模的长处,研究了基于数据驱动的社交网络舆情信息传播仿真建模的关键技术。基于微信信息传播实证数据,验证了从数据挖掘分析到信息时空传播模型构建和仿真的整个流程。本文的研究成果对社交网络舆情研究具有重要理论和应用价值。