基于情感词词典的褒贬倾向性分析

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:yuxjmail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展,网络中的评论信息越来越多的受到人们的关注,加快了文本褒贬倾向性分析的脚步。本文主要针对中文句子级别的褒贬倾向性分析做了以下工作:   1.建立了绝对情感词词典和相对情感词词典,对相对情感词词典通过算法判断了情感词的情感倾向性。   2.应用CRFs模型抽取了领域相关的产品的评价对象和评价词,通过本文提出的算法,引入已标领域相关语料,判断了评价词的情感倾向性,构建了领域情感词词典,同时识别了评价对象和评价词的二元词组,并对评价对象和评价词的词组的情感倾向性进行了计算,构建了领域评价对象情感词词典。   3.应用领域评价对象情感词词典中的词组的情感倾向性替换了独立情感词的情感倾向性,融合多个情感词词典,提出了中文句子级别褒贬情感倾向性分类算法。   本文对所设计的算法的正确性和实用性进行了汽车论坛评价语料、旅馆论坛评价语料和笔记本论坛评价语料三个领域的实验,结果表明,本文提出的算法在每一个实验的语料集合上都取得了较高的准确率和较好的召回率,从而证明了通用情感词词典的细分和引入领域情感词词典和领域评价对象情感词词典这些方法,随着情感语义信息的增加,配合合适的算法,会在褒贬分析中起着非常重要的作用。
其他文献
Assements presented to the different users of a wireless network system and social users network systems, in a certain level of performance to a data flow of d
数据挖掘是人工智能和数据库技术等领域的研究热点,正在现实应用中发挥着强大的作用。关联规则挖掘是数据挖掘中一个最活跃、最重要的研究课题,主要目的是从给定的数据集中发
互联网在线广告行业蓬勃发展,是一个具有数百亿规模的庞大市场。在线广告领域的核心问题之一是广告的点击率预测,准确的点击率预测模型对于提高广告收益具有重要意义。工业界和
当今社会是一个信息化社会,计算机网络的应用已经深入到日常生活的各个领域,人们的生活和工作也更加依赖网络,从而网络技术也就成为一个越来越重要的技术。大量网络应用对服
数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合,是为决策支持系统和联机分析应用提供数据源的结构化数据环境。数据仓库不同于数据库,数
随着生产水平的提高和企业规模的扩大,现代企业迫切需要一个报表平台系统,利用当前Internet的迅速发展,使得分布在不同地方的子公司或单位能够随时提交各种生产经营报表,从而对数
随着网络规模的日益扩展,网络体系结构模型越来越复杂,网络用户及承载业务种类也与日剧增。认知网络为解决当前网络所面临的日益增加的复杂度提供了新的解决途径,尤其是在无
本文以GPS定位技术为基础,综合利用GPRS无线传输技术、GIS地理信息技术,设计并实现了物流行业中对集装箱卡车的实时监控系统。系统以安装在集装箱卡车上的GPS接收机发送的定
真实感绘制中通常需要大量采样才能得到收敛的结果,在采样不充足的情况下,结果中常出现明显噪点,如何减少采样加快收敛是一个很重要的问题。光场具有低秩性和连续性,可以认为
建立数学模型是工程应用和科研中的一个重要环节。在工程技术、经济管理、自然科学和社会科学等领域普遍存在着许多随时间变化的动态系统和非线性现象。遗传算法用于智能建模