基于深度学习的多分类中文短文本情感倾向性研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:lpucicy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网产业的飞速发展,改变了人们之间传统的交流方式,网络上短文本数据大量积累,短文本大数据分析迫在眉睫。短文本情感分类是当前短文本研究领域的极其重要的一部分,也是自然语言处理研究方向中不可忽视的一个重要方面,我们需要的不仅仅是对于短文本粗浅的正负向情感的分析,更多类别、更深层次、更加准确的细致情感的划分才是我们现阶段要达到的研究目的。传统的分类模型主要是机器学习的各类模型,例如支持向量机、贝叶斯分类器、决策树等等。近年来,深度学习模型凭借着其独特的优势,俨然有盖过机器学习模型的势头。本篇论文提出了一种VC语料库合成方式、一种WCMG语料库合成方式和一种新的深度学习融合模型。在VC语料库合成方式中,将匮乏的、样本类别数目极不平衡的多情感分类标注的小语料库通过VC二项生成的方式重新构成新语料库,以实现小语料库的扩充和样本类别的平衡;在WCMG语料库合成方式中,将经过VC方式处理的Word2vec预训练词向量和经过VC方式处理的Glove预训练词向量以新的张量连接方式,重新对词向量进行架构,完成两种预训练词向量方式的优势融合,更好的提取出样本数据的特征;在新的深度学习融合模型中,通过对已然提出的多种深度学习分类模型的重现和实验分析,尝试着进行了一定程度的变形实验,提出了一种独特的模型融合方式。从众多的实验结果对比分析来看,VC语料库合成方式可以显著提升模型的准确率,而WCMG语料库合成方式和新的深度学习融合模型则是略微的提升模型的准确率,仍然有一定的改进空间。由此可见,本篇论文提出的VC语料库合成方式、WCMG语料库合成方式和一种新的融合模型相较于传统的语料库处理方式和深度学习模型,具有更强的特征提取能力和模型泛化性,提升了短文本情感分类的准确率。
其他文献
2015年12月21日,最高人民法院审判委员会第1673 次会议通过了《最高人民法院关于修改〈中华人民共和国人民法院法庭规则〉的决定》。根据该《决定》,对《中华人民共和国人民法
报纸
《滕王阁序》中有“物华天宝,龙光射牛斗之墟”一句,不了解古代天文知识的人,可能把其中的“牛斗”理解成牛郎星与北斗星,这是不正确的。
梅尼埃病是耳鼻喉科临床常见病之一,中医又名“耳眩晕”。本文从病因病机等方面分析,着重阐明因“瘀”致眩及其临床应用。
装配式建筑在近几年的建筑工程中被广泛应用。装配式施工使得建筑施工周期在很大程度上缩短,满足当今快节奏社会的需求。建筑影响着我们的住行,因此装配式建筑的广泛应用意味
<正>2013年11月,党的十八届三中全会公布了《中共中央关于全面深化改革若干重大问题的决定》(以下简称《决定》),《决定》提出:"加快公立医院改革,落实政府责任,建立科学的医
随着我国经济的快速发展,人们生活水平有了很大的提升,在精神生活上提出更高的要求,在此情况下推动着我国广播事业蓬勃发展。广播电台播音主持与广播电视主持有着非常大的不
目的:探讨米非司酮配伍米索前列醇用于人工流产的临床效果。方法:对2006年1月~2008年12月我院妇科门诊停经34—50天以内,年龄40岁以下,自愿要求行药物终止妊娠325例给予服用米非司
仿木结构建筑,是传统木结构建筑的现代传承形式,其产生的背景是20世纪80年代,钢筋混凝土材料在我国建筑中开始广泛使用,仿木结构景观建筑,又是众多仿木结构建筑中最为量大面广的一
研究斜行电梯的关键结构,分析电梯系统振动原因及其影响,模拟轿厢内的受力分析;通过改变斜行电梯可变角度倾斜机构,减低倾斜结构产生的水平加速度的可变角度倾斜结构,减小水
固定矫治器引入中国已有二十余年。中国正畸医师结合自身临床经验,在国外矫治器基础上设计出新的各具特色的矫治器,以传动直丝弓矫治器、六翼Free?Edge矫治器、六翼低摩擦轻力