基于深度神经网络的文本表示及情感分析研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:wdtt111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和移动互联网的高速发展,社交娱乐和电子商务等网络平台带来了海量的非结构化文本。这些文本含有情感极性,对这些文本进行情感分析可用于舆情分析、产品评论等任务上。面对这些海量文本数据,人工分析已然不符合当前形势,需要通过计算机利用自然语言处理技术挖掘有效信息。本文主要利用深度学习特征组合的方法学习文本的深层语义特征,通过针对性改进构造深度神经网络将提取到的特征对文本数据进行情感分析。本文的主要工作有:本文分析了主流的深度学习模型卷积神经网络(CNN)和长短时记忆人工神经网络模型(LSTM)。借助CNN和LSTM的优势,在CNN的基础上联合树形LSTM网络将它们的输出层进行融合构造情感分析模型(Att-CL)。该模型利用注意力机制对词向量进行组合,组合词向量作为CNN的输入解决句中词语间的长距离相关性问题,并通过树形递归LSTM学习整个句子的语义信息丰富了句子特征的向量表示。该模型不仅可以挖掘出与情感分析任务关联性较强的特征,而且能够依据句子的语法结构学习文本的语义特征。实验表明该混合神经模型通过协同训练后在微博情感分析任务上较单一神经网络模型性能出色。本文的另一项工作是结合语义规则与双向LSTM提出一种篇章情感分析的深度神经网络模型。该模型利用双向LSTM以序列组合的方式学习篇章深层语义特征,并通过语义规则获取篇章的多个情感特征,将情感特征通过全连接层的输出与双向LSTM的隐含层输出进行融合。即通过双向长短时记忆神经网络以词向量为输入学习句子向量表示,随后以句向量为输入对篇章进行建模获得其向量表示,将语义规则方法得到的情感特征经过非线性变化与深层语义特征相融合,最终将融合特征传入分类器进行分类。通过与一些深度学习模型实验对比,基于双向LSTM与语法规则结合的模型性能要优于其他深度学习模型。
其他文献
介绍了数字暗房的概念和组成,分析了数字暗房的优点和缺陷,并对数字暗房的发展前景进行了展望。
工程项目质量管理是工程项目管理的重要内容,在整个工程项目管理中处于核心地位,是企业生存发展的根本,也是促进社会主义现代化建设的关键。主要围绕影响工程项目质量管理的
随着电视新闻事业的不断发展,出镜记者正在成为电视新闻的"第一看点"。相比中央电视台以及各个卫视,地方台所主打的是民生牌,其出镜记者的出镜表现技巧也应具有独特性,以符合
数据采集与监控系统是中国石油油气生产物联网系统(A11)建设的重要组成部分。该系统应用检测和控制技术,实现油气田生产过程各类参数自动采集、自动检测(监测)和远程监视控制
李白诗歌的总体风格前人概括为“豪放飘逸”,其写景诗尤其是咏月诗最能体现这种诗风。李白的咏月诗想象力超旷飘逸,融注着诗人狂放不羁的个性和豪放飘逸的襟怀
农用土地的流转是影响一个国家农业发展的重要因素,世界各国土地流转制度的发展过程不尽相同,而法律制度是农用土地流转和农业发展的保障。发达国家的农用土地流转制度经历了
<正>上世纪二十年代,法国建筑师马勒-斯蒂文斯(Robert MalletStevens)(1)为电影《无情的女人》L’inhumaine (1924)完成了场景设计,进而开启了电影艺术与建筑艺术比肩而行的
随着智能变电站地出现,电网地运行和管理工作也逐渐趋向于自动化和智能化。这也是将来变电站发展的一种趋势,它不仅能够将传统变电站存在的问题进行优化和完善,还大量避免了
目的评价人源化抗Her2/neu单链抗体及人白细胞介素2(hIL-2)双功能融合蛋白H520C9scFv-hIL-2治疗Her2/neu阳性肿瘤的效果。方法将构建的表达载体转染293细胞,G418筛选阳性克隆建