微博中话题的传播模型及热点预测

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:mysky_588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为新兴的网络社交平台,因其信息流通速度快、信息内容丰富、人群覆盖面广吸引了大量用户的加入,这使得微博在舆论传播中的作用日益凸显。有很多微博是围绕同一相关事件而展开讨论的,这便构成了一个话题。研究话题的传播规律并对热点话题进行有效预测,有助于我们了解事件的发展动态及趋势,可用于新闻热点的挖掘和不良信息的监管等领域。本文介绍了微博中话题的传播模型及完整的热点预测系统流程,包括数据的获取及预处理、话题聚类和热点话题预测模块。论文的主要工作有:1.由于微博中包含大量的广告、商家促销、活动宣传等无意义信息,本文提出了一种从用户和微博两个角度构建微博特征向量的方法,通过支持向量机(Support Vector Machine, SVM)实现了信息的有效过滤;2.论文将话题传播过程划分为三个阶段(即潜伏期、爆发期与消退期),统计各个时期用户特征项及微博特征项的变化规律,并采用VIP用户比例、用户粉丝数分布、#话题标签和url外链比例四个特征刻画话题传播,取得了较好的实验结果;3.论文采用了基于“潜在基底”假设的分类模型,并提出了时序信号表示话题趋势的方法,最后对话题进行热点预测和参数分析。实验结果表明83.5%的话题可以提前预测,平均提前时间约为1.6小时,验证了算法的有效性。
其他文献
利用声目标产生的声波,对目标进行识别是被动声探测系统的基本任务,目标识别技术属于模式识别理论的研究范畴,其关键在于特征提取和分类器的设计。 本文首先应用现代信号处理
在4G及未来移动通信网络中,用户的无线数据业务将呈爆炸性增长趋势,而且随着移动通信发展的趋势从承载语音为主转为承载数据为主,目前的宏小区会无法支持与日俱增的无线数据
本论文共包括五部分内容,即前言、花蝽科成虫臭腺及雌虫交配管的形态研究、花蝽科各属间系统发育关系的研究、花蝽科属及部分种的系统学研究以及生物地理分析。   在前言
高速公路监控系统在现代高速公路的营运管理中起着举足轻重的作用。随着通车里程的急剧增长,区域性路网正逐步形成,独立路段监控系统已经不能高效发挥交通监控的路径诱导、多路
人类正在走进数字化网络信息时代,而数字化设备的有线连接给人们随时随地与信息网络相连以及相互通信带来了诸多不便。发展无线通信连接技术,将人们从有线连接中解放出来是一种
随着国民经济的发展,具备良好资源分配、网络监控和先进通信系统的智能电网的建设刻不容缓。智能抄表系统作为智能电网信息采集系统,因其低功耗、低成本、易组网等突出特点成为不二之选。本文基于抄表系统硬件平台,完成了智能抄表无线网络MAC的设计与实现,包括系统组网、信道接入以及数据传输功能的实现,同时,对系统性能进行了测试分析,提出了超帧的改进方案并进行了仿真验证。论文的主要内容以及创新点如下:第一,提出了
近年来由于无线通信技术的迅猛发展,工作频率日益提高,射频电路得到了广泛的应用,由此也导致了对精通射频电路设计的工程师的巨大需求。人们越来越清楚地认识到射频设计在整个无
超声多普勒技术因无创伤检测血管疾病,在临床医学中具有广泛的应用。运动的红血球细胞反射的超声波束形成了超声多普勒血流信号,诊断信息就可由此信号中提取。然而在利用超声多
数字视频压缩算法已经广泛应用于视频广播、流媒体传输、视频会议和节目存储等众多领域。针对不同的应用需求,有诸如JPEG、JPEG200、MPEG-1/2/4、H26x系列压缩算法标准。不同
随着网络访问的日益普及,网络安全成为非常关键的问题。现有的许多入侵检测系统通常只能检测到已知或定义好的入侵行为,而且在性能上存在高误报率和漏检以及时间延迟等问题,本文