基于深度学习的社交媒体文本立场分析研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shuimolanting
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展和智能终端的快速普及,越来越多的用户在社交媒体平台针对各类事件发表自己的立场和看法。用户针对具体对象和事件的立场态度对商业机构与政府机关决策具有重大的价值。传统情感分析只对文本表面的情感表达进行正负面分类,难以挖掘文本中用户针对特定事件话题的立场。因此,针对特定话题的社交媒体文本立场分析研究具有重要的科学研究价值和广泛的应用前景。现有的文本立场分析方法主要分为两类,分别是基于特征工程机器学习的方法和基于深度学习的方法。基于特征工程机器学习的立场分析方法需要构造和选择大量的特征,往往对语言学知识具有较高要求,同时经常受到训练样本不足导致的特征稀疏的影响。基于深度学习的方法往往直接将立场分析视为简单的文本分类问题,很少结合社交媒体文本词嵌入中的背景知识,也没有有效利用立场分析中特定话题的信息。针对以上问题,本文使用社交文本词嵌入作为背景知识,结合深层记忆网络的注意力机制,研究基于深度学习的社交媒体文本立场分析方法。本文首先在利用大规模社交文本预训练的词嵌入基础上,研究一种基于卷积神经网络的文本立场分析方法。在Sem Eval英文立场分析数据集和NLPCC中文立场分析数据集上的实验结果显示,该方法取得了Semeval数据集F值0.6752、NLPCC数据F值0.7036的成绩。在若干子话题上的性能超出评测最佳队伍,综合性能均列中英文两立场评测任务的第2位。同时,分析发现,相对于随机赋值等词嵌入初始化方式,社交媒体文本预训练词嵌入的加入能够有效提升模型的立场分析性能。针对现有研究往往对特定话题信息缺乏有效利用的问题,本文进一步提出一种利用深层记忆网络的注意力机制评估特定话题与文本成分关联关系的立场分析模型。该模型读取文本和话题的词嵌入表示,结合深层记忆网络的记忆机制和注意力机制,利用多个网络层叠加学习多层次的文本表示,分析得到文本对特定话题所持有的立场倾向。实验结果显示,该方法在Sem Eval数据集中的平均F值为0.6821,比该评测中表现最好的迁移学习模型提高了0.39%;在NLPCC数据集中的平均F值达到0.7140,较评测最佳模型提升了0.34%。该结果显示了本文提出的方法在社交媒体文本立场分析中的有效性。
其他文献
`随着时代发展,网络遍及各个角落,网络为人类提供了很大的便利和快捷,但是网络安全问题也日益严峻,尽管各种各样的病毒软件,防火墙和入侵检测系统越来越多,依然阻止不了网络犯罪的
视觉目标跟踪(Visual Object Tracking)在智能监控、人机交互、无人驾驶、虚拟现实等领域有非常重要的应用价值,一直以来都是计算机视觉领域的研究热点。近几年,相关滤波跟踪
随着软件系统规模的不断扩大及系统运行环境动态性的日益凸显,研究软件以集成方式进行自适应动态演化的相关理论和方法,对重用已有资源、构建高可用性软件系统、延长软件生命周
Hopfield神经网络已经在广大领域得到了应用,但是单纯的人工神经网络只是对生物神经网络的简化、抽象和模拟以实现对人脑结构的模仿,这种模仿就目前来说还处于较低水平,为此科学
温室大棚作为现代化农业的应用之一,其环境监测普遍采用的是有线通信方式,有线通信方式中的信号传输虽然相对比较稳定,但复杂的布线和较高的成本不利于进一步提高温室的自动
随着我国加入WTO,国民经济不断发展,国内企业越来越认识到商标的重要性,并逐步将商标专利提升到企业战略的高度。目前一些依赖分类和文本标注方法的商标查询系统面对百万级以上
近些年来,随着Web服务广泛应用,Web服务数量的急剧增加,Web服务的发现变得越来越困难,如何在海量的Web中找到所需的内容显得尤为重要。  传统的Web服务是静态的服务,没有语义信
近年来,移动互联网技术发展迅猛,移动智能设备大量普及,大量线上服务从PC端转移到移动端。移动端服务的提供,给人类生活带来极大便利。身份认证是移动端产品使用中必要的步骤
随着电力和电子技术的不断发展,各种电力电子设备应用日益增多。这些设备的增加在方便人们日常工作与生活的同时也给电网带来了谐波污染。特别是那些具有非线性和冲击性特点
随着计算机网络的不断发展,人们在受益于网络的同时,网络系统的安全保护问题也越来越突出。现如今网络系统受到的攻击越来越普遍,攻击的手法也越来越复杂,网络安全加密技术例