基于循环神经网络的谣言检测

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:jzsoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体的快速发展,大量的社会热点新闻在以新浪微博和Twitter为代表的社交媒体平台快速生成和传播。然而,社交媒体平台在成为新闻发布和传播的便利渠道的同时,也一定程度上造成了虚假新闻的泛滥。虚假新闻可以在社交媒体平台上迅速传播从而影响人们生活,甚至危害社会。虽然人工检测谣言可以一定程度上减少谣言危害,但是其检测过程需要耗费大量时间;传统的自动谣言检测方法利用机器学习算法对谣言的社交特征进行分类,但是这些方法忽略谣言内容本身的语义特征。近年来,循环神经网络在自然语言处理领域有了重大突破。同时,多特征融合技术与注意力机制可以进一步提升模型的表达能力与分类性能,这些为谣言检测领域带来了启发。  本文主要研究基于循环神经网络的谣言检测算法,利用多特征融合和注意力机制等技术对社交媒体上的新闻进行谣言识别。主要研究工作包括:  1.设计基于多特征融合的循环神经网络模型来检测消息级谣言。该方法首先对一条待分类文本进行社交特征的提取,同时将文本映射成基于词向量表示的文本矩阵,接着通过循环神经网络将社交与文本两种信息进行融合,得到消息的向量表示。实验结果显示,该模型的检测性能不仅优于传统谣言检测方法,更要比使用单一种类特征的模型有效。同时,本文构建并公开了基于新浪微博平台的谣言数据集。  2.提出了基于社交注意力机制的层次化双向循环神经网络模型来检测事件级谣言。由于新闻事件中含有大量的转发评论信息,这些信息是时序性数据,所以该方法首先在消息集合上提取全局的社交特征,并使用层次化双向循环神经网络来对不同的语义层进行学习。利用社交注意力在学习中筛选有用信息,提高模型的表达能力。实验结果显示,该模型比其他谣言检测模型能更有效地检测谣言。在早期谣言检测任务上,该模型同样达到了良好的检测性能。
其他文献
本文介绍了实际软件项目中优化问题的基本理论,方法和问题分类,以及优化问题的各种数学模型,比较了各种模型的特点,同时通过对多个实际软件项目的优化研究基础上,讨论了算法优化,数
随着信息获取、处理和传输等技术的不断发展,我们可离线重构地球上城市和海洋等复杂环境的三维数字模型,并将各种实时获取的动态信息接入该虚拟环境,形成与现实物理世界相对应的
SIP是下一代网络中的核心协议之一,用于建立、修改和终止IP网上的多媒体会话。SIP协议因其可扩展性、灵活性、互操作性、可重用性有很广泛的应用领域。但是基于TCP/IP网络的SI
学位
数据可视化环境能够对科学研究中产生的数据通过图形的方式进行展示,便于研究人员对于数据内部包含的信息进行探索和研究。随着计算机技术和工业技术的飞速发展,人们获取信息的
移动多媒体消息业务是基于无线GSM网络之上,能提供多媒体信息实时传送的通信增值业务。但目前该业务本身及其所依赖的无线网络和分组数据网络存在着诸多自身的安全问题阻碍了
学位
随着无线网络应用的日益普及,复杂的语音、数据、视频等多媒体业务的不断涌现,无线网络的用户量急剧增加。由于各类无线网络所能提供的业务类型和传输能力差异极大,如何将类型各
随着Internet的快速发展,网上信息资源越来越丰富,网络已经成为人们获取信息的重要途径。但因Internet所固有的开放性、动态性与异构性,又使得用户很难准确快捷地从WWW上获取所
近半个世纪以来,随着计算机科学和新兴交叉学科的迅猛发展,人们对混沌现象在自然科学领域和社会科学领域的表现有了更深刻的认识,使得对混沌的研究迅速渗透到各个领域。混沌
无线传感器网络综合了传感器、嵌入式系统和无线通信等技术,具有广泛的应用前景。采集语音、图像、视频等多媒体信息的多媒体无线传感器网络是当前的研究热点之一。   本文
半监督学习技术试图利用未标记数据来辅助提高学习系统的泛化能力,已成为当前机器学习的研究热点之一。   协同训练是半监督学习领域的一种主流风范。标准协同训练算法需