面向中文短文本的情感分析关键技术研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:resident_2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络时代的快速发展,人们的日常生活同互联网的关系日益密切。人们习惯在网络中倾述自己的看法,表达自身情感以及思想,这使得互联网上出现了非常多的短文本信息。利用自然语言情感分析技术来处理这些短文本信息,从而可以获取到用户们的情感倾向。这些情感信息对社会舆情分析,商品销售与改进等方面都有着很大的价值。而本文面向中文短文本,针对商品评论数据,从基于机器学习和基于深度学习两个方面出发进行中文短文本情感分析研究。在基于机器学习的短文本情感分析研究工作中,本文分别使用朴素贝叶斯和支持向量机算法构建情感分析模型。为了提升模型的情感分析性能,本文在情感分析流程中的文本向量生成环节,提出使用两种改进型方法来生成文本向量。其分别为使用改进的卡方统计量进行特征项选取后并进行加权来得到文本向量,以及使用加权词向量的方法来得到文本向量。通过设计实验对各个模型进行对比,实验结果表明本文所使用的两种改进型方法均对模型在情感分析性能提升方面有一定的作用。其中使用改进的卡方统计量结合加权生成文本向量的方法对模型情感分析准确率的提升作用更大。在基于深度学习的短文本情感分析研究工作中,本文提出使用基于注意力机制的双向长短期记忆神经网络(AM-BLSTM)模型来进行短文本情感分析。在该模型中,长短期记忆神经网络(LSTM)解决了普通循环神经网络(RNN)在训练数据时出现梯度溃散以及无法长距离依赖的问题,双向长短期记忆神经网络(BLSTM)则对LSTM模型只能从单向获取信息的缺陷进行了改进,而注意力机制模型的引入使得AM-BLSTM模型能够对句中的情感词汇给与更多的关注,从而更好的进行情感倾向性的判断。通过分别与LSTM模型,BLSTM模型进行短文本情感分析实验对比,结果表明本文所构建的AM-BLSTM模型能够有效提高情感分析的准确率。此外在基于机器学习和基于深度学习的情感分析实验中,本文针对会影响实验结果的部分重要参数进行了多组实验对比,以此研究这些参数对模型结果的影响,从而使得模型的情感分析性能达到最优。最后对本文构建的包括机器学习以及深度学习在内所有模型进行情感分析性能对比,得出AM-BLSTM模型表现最佳,并对其模型搭建系统进行展示。
其他文献
目的:研究经颅彩色多普勒超声配合彩色多普勒超声在脑卒中高危人群筛查中的价值。方法:选择脑卒中高危患者作为本次研究患者或研究对象,并采用“电脑随机法”将200例脑卒中高
我们应该拒斥"道德相对主义"这一称号,但必须承认道德具有相对性。道德总是特定文化中的道德。全球化不可能消弭多种文化的差异而发展出一种全球同质的文化。道德源自共同生
对于密尔在《论自由》一书中所捍卫的自由原则,传统的解释一般以第一章为重点,这个解释方案被称为"伤害原则",即社会或国家权威干涉个人自由的唯一正当理由是防止对他人的伤
高等级半刚性基层沥青路面典型的早期破坏现象主要有:水破坏、辙槽、泛油、裂缝、平整度下降、沉陷等。本文通过大量的实地调查及实验数据,分析发现空隙率在各种类型的破坏中均
信息化是当今时代发展的大趋势,代表着先进生产力。人类已经步入信息时代,信息技术飞速发展,以计算机为代表的生产工具改变了人们的生产方式、工作方式、生活方式、学习方式
突涌是基坑工程施工过程中常遇的主要灾害之一。现有的承压水基坑突涌稳定分析方法均不能反应突涌破坏机理。从水力劈裂的机理入手,建议承压水基坑突涌问题应考虑应力-渗流场
采用有限元数值模拟分析技术,研究因隧道开挖施工而引起周围土体及不同位置单桩的变形规律。在分析中考虑了不同位置单桩和桩—土相互作用的影响。系统数值试验研究成果显示:
随着社会的不断发展,科技的不断进步,我国各个领域均得到了很好的发展,工业生产方面亦然.如今已经进入了新社会,传统的工业厂区已经无法满足当代社会的发展要求和发展趋势,现
民进党追求“台独”面临着东亚区域合作产生的压力,两岸政策和区域政策出现断裂。基于绝对收益的考虑,台湾当局力图参与东亚区域合作,但遭遇两岸关系的牵制。在两岸关系中,民