基于混合信息增益算法的文本情感分析

来源 :计算机科学与应用 | 被引量 : 0次 | 上传用户:ding89629
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统信息增益特征选择方法存在的选择偏向性的现象以及未考虑特征元素在不同类别间词频的问题,提出了一种混合信息增益的文本情感分析算法。通过引入逆文档频率系数、类间特征词频系数和卡方统计量系数,对文本数据进行特征选择,使得整个文档中词频信息、每个类之间的词频信息以及重要情感色彩的低频词信息得到有效利用。实验结果表明,采用混合信息增益的文本情感分析方法可以有效地提高特征选择的质量,进而提高文本情感分析的准确率,大约2%~5%。
其他文献
关系提取可以获得文本中的关键信息。实体关系提取是在非结构化文本识别出实体并提取出实体对之间关系的方法。针对传统的关系提取借助外部NLP工具和局部分类等问题,端到端的
目的:为进一步研究和开发民族药酸叶胶藤提供理论依据。方法:采用来源鉴定、性状鉴别、显微鉴别及理化鉴别的方法。结果:主要组织特征为中柱鞘部位由石细胞及纤维形成环状,可见
针对乳腺癌智能诊断中的分类器欠稳定,样本分布适应性差等问题。本文提出一种基于Adaboost集成BP、RBF及Naïve Bayess三网的分类器构建算法。首先,采用三种不同的分类算
笔者于2010年应用培元通络贴膏配合针刺治疗腰痛150例,取得一定疗效,现报道如下。
广博的人文基础知识、良好的心理素质和道德品质、较强的人际交往和沟通能力、接收新信息的能力、对现代多媒体技术的熟练掌握,是高校辅导员应具备的素质与能力。加强思想政治
在自动分拣领域,机器视觉技术起到举足轻重的作用,本文采用一种基于三维点云处理技术的方法对工件进行识别和匹配,从而从生产线上的杂乱工件堆中分拣出目标工件。首先,利用激
外语类高校核心竞争力是长期形成并融入到学校内质中的独特优势,是推动学校持续发展和保持优势的源泉,具有独特性、累积性和功能性三大本质特征。立足外语类高校核心竞争力的三
目的:研究牵引舒筋结合整脊疗法对神经根型颈椎病的临床疗效.方法:随机将80例神经根型颈椎病患者分为治疗组40例与对照组40例;治疗组行牵引舒筋结合整脊疗法,对照组行牵引舒筋