论文部分内容阅读
随着互联网和移动互联网的高速发展,社交娱乐和电子商务等网络平台带来了海量的非结构化文本。这些文本含有情感极性,对这些文本进行情感分析可用于舆情分析、产品评论等任务上。面对这些海量文本数据,人工分析已然不符合当前形势,需要通过计算机利用自然语言处理技术挖掘有效信息。本文主要利用深度学习特征组合的方法学习文本的深层语义特征,通过针对性改进构造深度神经网络将提取到的特征对文本数据进行情感分析。本文的主要工作有:本文分析了主流的深度学习模型卷积神经网络(CNN)和长短时记忆人工神经网络模型(LSTM)。借助CNN和LSTM的优势,在CNN的基础上联合树形LSTM网络将它们的输出层进行融合构造情感分析模型(Att-CL)。该模型利用注意力机制对词向量进行组合,组合词向量作为CNN的输入解决句中词语间的长距离相关性问题,并通过树形递归LSTM学习整个句子的语义信息丰富了句子特征的向量表示。该模型不仅可以挖掘出与情感分析任务关联性较强的特征,而且能够依据句子的语法结构学习文本的语义特征。实验表明该混合神经模型通过协同训练后在微博情感分析任务上较单一神经网络模型性能出色。本文的另一项工作是结合语义规则与双向LSTM提出一种篇章情感分析的深度神经网络模型。该模型利用双向LSTM以序列组合的方式学习篇章深层语义特征,并通过语义规则获取篇章的多个情感特征,将情感特征通过全连接层的输出与双向LSTM的隐含层输出进行融合。即通过双向长短时记忆神经网络以词向量为输入学习句子向量表示,随后以句向量为输入对篇章进行建模获得其向量表示,将语义规则方法得到的情感特征经过非线性变化与深层语义特征相融合,最终将融合特征传入分类器进行分类。通过与一些深度学习模型实验对比,基于双向LSTM与语法规则结合的模型性能要优于其他深度学习模型。