【摘 要】
:
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和
【机 构】
:
广东外语外贸大学国际工商管理学院,广东外语外贸大学思科信息学院,广东外语外贸大学英语语言文化学院
论文部分内容阅读
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。
其他文献
为规范微波效应实验最小样本量,采用区间估计的统计推断方法,开展了样本作用概率与总体作用概率对应关系的分析和研究工作,对满足一定置信度和一定总体作用概率下所需要的最
本文深入剖析了广西非设关地走私的历史演变和主要特点,以及主要成因,全面总结回顾近年来广西地方党委政府和相关执法部门在打击治理非设关地走私工作方面采取的主要措施,深
中国叙事的存在可谓源远流长,战国以后,中国的叙事艺术蓬勃发展,出现了大量的叙事作品。中国古代叙事作品有三种形态:文本叙事、舞台叙事、民间口头叙事。中国古代叙事思想、
本文选用NSGA Ⅱ作为求解VRP多目标优化问题的算法基础,分析概括出VRP的三个主要目标函数和三个约束条件,实现了VRP多目标优化问题的数学建模。选择MATLAB作为软件工具进行代
<正> 一 应当改善科技发展 科技发展环境,主要是指政府通过制定科技发展战略、政策和规划对本国科技的宏观调控和导向,并通过科技管理体制、运行和激励机制及相关措施,为本国
<正> 甲醇 甲醇是目前应用最广泛的车用发动机代用燃料。甲醇的着火性能很差,抗爆性却很好,具有较高的辛烷值,因此一般用于点燃式车用发动机。点燃式甲醇车用发动机的压缩比
实现教育的目标和家长期望的教育价值,需要构建科学合理的:包括良好的人生修养、适应时代发展的特殊能力、明显而突出的智力优势和健全而良好的心理素质等因素,同时需要树立
长期以来,我国的水产品出口都位居大宗农产品出口的首位,但是水产品出口贸易在快速发展的同时也存在着不少的问题。文章通过对2009年我国水产品出口贸易基本情况的介绍,提出
为天线匹配阻抗与结构参数之间的优化设计,提出RBF神经网络用于建立对称弯折缝隙天线匹配阻抗与几何结构参数之间的多变量、非线性模型;解决了使用全波分析工具计算所耗时间