基于改进的Word2vec的评论情感倾向性分析

来源 :湖南大学 | 被引量 : 0次 | 上传用户:shashh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词表示技术是深度学习在自然语言处理(NLP)领域的突破。词表示技术是将词转化成为向量表示。词向量被广泛应用于各种NLP任务。Word2vec是Google在2013年发布的一款将词表示为实数值向量的高效工具。词语是文本中承载语义信息的最小单元。英文单词由字母组成,中文词语由汉字组成。借鉴英文词表示的方法,中文词表示引入了汉字的信息。研究表明,将汉字的语义信息融入词表示中,得到的词向量在某些NLP任务中取得了成功。但是现有的模型在考虑汉字对词语的语义贡献程度上存在一定的局限性,使学习到的词向量在一些NLP任务上表现的差强人意。针对这个问题,本文提出了一种基于注意力机制的词表示方法,该方法利用《同义词词林扩展版》来计算字词间的语义相似度。实验证明,通过该方法获得的词向量在词语的语义相关性实验上要优于现有的基线模型。并且将改进的Word2vec应用于微博评论的情感分析任务上也取得了较好的结果。本文具体的工作内容如下:1.本文提出了一种增量式的词向量学习方法,使其在面对语料库的新增内容时,不需要重新训练所有的语料库,仅做由于新增数据所引起的更新。2.本文提出了一种基于注意力机制的字词联合训练模型ACWE,利用词林来计算字词间的语义贡献程度。通过语义相关性实验证明,本文提出的方法要优于现有的基线模型。3.将改进的Word2vec应用于微博评论的情感分析上,通过实验验证了改进后的Word2vec的有效性。
其他文献
以母语迁移理论为依据,运用对比分析法、错误分析法及中介语理论相结合的方法,对大学生英语写作受到母语影响的现象进行了研究和分析,并从中得到一些教学启示。
绿色物流又称环保物流,表现为一种节约资源、保护环境的理念,因此,实施绿色物流管理是一项有利于社会经济可持续发展的战略措施。对企业而言,实施物流绿色化管理战略,将给企
<正>写景状物类文章是语文学习中一道独具韵味的风景线,或描摹山川名胜,抒写地域景致,叙述特定事物,或游览参观,寻踪探微,借物喻人,托物言志,都是写景状物类文章的内容对象。
绿色生态园林建设体现于规划设计、施工、养护每一个环节。文章以山西潞城市为例,对节约型园林绿化建设及管理养护问题进行探讨,提出具体技术措施。
筛选连翘种子油纳米乳最佳处方,并对其进行体外评价。通过溶解度试验、三元相图的绘制,筛选最佳处方;通过考察粒径大小分布、Zeta电位、折光率、加速、光照、高温、低温试验
孔子在两千多年前就提出并积极实践因材施教思想。孔子的因材施教是在培养德才兼备的从政君子这一宗旨之下展开的,因此,他无论对学生的考察还是对学生的培养都是从这两个大的
研究6种大孔吸附树脂对万古霉素的静态吸附与解吸性能,从中选出最适树脂进行动态吸附实验,研究上样液浓度、pH值、上样体积流量对树脂动态吸附量的影响及洗脱过程。结果:选择