基于复杂句式文本情感分类研究

来源 :太原理工大学 | 被引量 : 3次 | 上传用户:cq3535251214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的高速发展与开放性不断提高,对网络文本中主观内容的情感倾向性识别成为文本信息处理的研究热点。当今对大数据的研究越来越热,人们对数据分析有了更高的需求,文本表达方式的自由化与多样化等问题会使文本中出现更多的复杂句式从而影响句子级情感分析的结果,目前现有方法针对复杂句式的情感分类准确率欠佳。本文首先针对中文复杂句的结构特点对多种复杂句进行了详细的情感分析,总结出7种复杂句式,将引导复杂句的关联词归纳为三类,根据对复杂句的分类,总结复杂句匹配模型,提出一种适用复杂句的情感三分类判定规则。然后本文基于Word2vec词向量模型进行基础情感词典的扩展,将现有情感词典中的情感词选用种子词,获得与种子情感词余弦值较大的词语集,得到已有情感词的相近词。之后对前一步得到的相近情感词运用改进后的语义相似度算法过滤更新近义词集,并收集网络热点词,完成情感词典的构建。情感词典的建立和扩充是文本情感分类研究工作的基础。情感词典的完善对情感分类准确率的提高有很大作用。本文将情感倾向分为褒贬中三类,构建复杂句情感评判规则CSSCM并结合SVM进行训练和预测,对复杂句和随机句分别进行情感分类,并对结果进行比较。同时本文提出多通道可变滤波器动态多池卷积神经网络模型MVDCNN进行情感分类,在卷积层中提取多粒度词语特征,并结合不同词嵌入版本(Word2vec+Glove)预训练词向量,动态多池层利用复杂句式关联词做分割,关联词前后段分别提取最大特征值,不断训练网络进行情感三分类。实验最后将SVM、CNN、CSSCM、MVDCNN四种模型的情感三分类准确率进行了对比,基于随机句的SVM、CNN、CSSCM、MVDCNN四种模型情感三分类准确率分别达到50.6%,52.0%,53.7%,55.2%。基于复杂句的SVM、CNN、CSSCM、MVDCNN四种模型情感三分类准确率分别达到51.5%,52.8%,54.9%,56.3%。实验结果表明本文提出的CSSCM模型在处理精度方面比传统句子级情感分类方法有了明显的优化,MVDCNN模型进一步提高了情感三分类准确率,获得良好的情感分析效果。实验结果证明了本文提出的方法使复杂句和随机句的情感三分类准确率有不同程度的提高,进一步提高了系统性能,展现出优良的性能。
其他文献
<正>福建连城县地处闽、粤、赣三省结合点,是革命老区和贫困县。近日,这个人口仅30余万的闽西小县出名了。其之所以名声大噪,源于席卷全县的一起腐败窝案。该县四套班子中,有
新《慈善法》9月1日实施,类似众筹等方式的慈善行为将有法可依。当公益遭遇互联网,究竟擦出了怎样的火花、又出现了哪些偏颇?近些年,借助互联网,公益活动开始朝向精细化、全
期刊
针对循环流化床氢氧化铝焙烧系统,基于Delphi对整个焙烧系统的物料平衡、能量平衡和尺寸设计进行了软件平台的开发工作,为设计人员提供了一个方便、快捷、清晰的计算机辅助设
<正>人大代表是国家权力机关的组成人员,代表工作是人大工作永恒的主题。认真做好人大代表工作,充分发挥人大代表作用,人大及其常委会才能更好地履行宪法和法律赋予的职权,人
该文在新考试大纲的背景下,研究中职数学建模的必要性,并探索如何进行数学建模的教学。
介绍和分析了氧化铝流态化焙烧炉内衬的引进技术、材料 ,介绍了在引进的基础上开发和研制的具有独立知识产权的焙烧炉内衬设计技术和新材料的使用经验 ,对今后炉内衬的开发研
初冬的洛南,激情勃发,硕果累累。全县重点项目建设呈现出一派火热繁忙的景象:张坪水库建设现场机器轰鸣、工人挥汗如雨繁忙施工,龙盛亚纯电动汽车建设项目生产线紧张调试,华润
混合动力汽车的动力耦合系统结构和参数匹配影响整车性能,通过对动力耦合系统的结构选择、参数匹配和控制策略的研究,以传统汽车的差速器作为动力耦合器并建立模型,并对此模
选择144例采取前列腺电切除术治疗的良性前列腺增生症患者,随机分为对照组和观察组各72例,其中对照组仅采用常规护理方法,观察组实施综合护理干预措施,将两组患者术后的并发