论文部分内容阅读
随着社交媒体的快速发展,大量的社会热点新闻在以新浪微博和Twitter为代表的社交媒体平台快速生成和传播。然而,社交媒体平台在成为新闻发布和传播的便利渠道的同时,也一定程度上造成了虚假新闻的泛滥。虚假新闻可以在社交媒体平台上迅速传播从而影响人们生活,甚至危害社会。虽然人工检测谣言可以一定程度上减少谣言危害,但是其检测过程需要耗费大量时间;传统的自动谣言检测方法利用机器学习算法对谣言的社交特征进行分类,但是这些方法忽略谣言内容本身的语义特征。近年来,循环神经网络在自然语言处理领域有了重大突破。同时,多特征融合技术与注意力机制可以进一步提升模型的表达能力与分类性能,这些为谣言检测领域带来了启发。 本文主要研究基于循环神经网络的谣言检测算法,利用多特征融合和注意力机制等技术对社交媒体上的新闻进行谣言识别。主要研究工作包括: 1.设计基于多特征融合的循环神经网络模型来检测消息级谣言。该方法首先对一条待分类文本进行社交特征的提取,同时将文本映射成基于词向量表示的文本矩阵,接着通过循环神经网络将社交与文本两种信息进行融合,得到消息的向量表示。实验结果显示,该模型的检测性能不仅优于传统谣言检测方法,更要比使用单一种类特征的模型有效。同时,本文构建并公开了基于新浪微博平台的谣言数据集。 2.提出了基于社交注意力机制的层次化双向循环神经网络模型来检测事件级谣言。由于新闻事件中含有大量的转发评论信息,这些信息是时序性数据,所以该方法首先在消息集合上提取全局的社交特征,并使用层次化双向循环神经网络来对不同的语义层进行学习。利用社交注意力在学习中筛选有用信息,提高模型的表达能力。实验结果显示,该模型比其他谣言检测模型能更有效地检测谣言。在早期谣言检测任务上,该模型同样达到了良好的检测性能。