基于AdaBoost-Bayes算法的中文文本分类系统

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:jh_viso1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文文本分类准确率低,分类算法低效不稳定问题,提出基于自适应提升朴素贝叶斯算法.该算法采用Naive Bayes和AdaBoost,并且通过优化组合结构,融合两种算法的优点.首先,使用SMEL序列组合成词算法对中文语料进行分词,提取文本特征词汇.然后,使用增强的贝叶斯分类器,通过较小的样本训练,提取出文本特征,生成训练分类矩阵.结合自适应提升算法对简单分类器进行加权,保证分类有平稳准确的效果.通过实验证明,该算法与其他算法相比,错误率更低,可以使分类准确率达到98%以上,而且F1值也优于其他分类算法.
其他文献
胶州湾是山东沿海重要的滨海湿地,海平面上升和海水倒灌的问题一直影响着这里。一方面由于湿地退化导致景观弹性愈发下降,另一方面由于政府的退田还海策略,产生了大量失地农
迟华基教授认为糖尿病并不等同于中医消渴,认为糖尿病的消渴阶段由'脾瘅'发展而来,临床应注重脾胃湿热因素。因此糖尿病前期治疗以清利脾胃湿热为主,后期治疗以活血
帕利哌酮缓释片是一种新型的非典型抗精神病药物,是一项全球性的首创以突破性口服药物传递系统(OROS)专利型渗透泵控释技术研发而成的治疗精神分裂症药物,是利培酮代谢后的活性
目的研究急诊救治阵发性室上性心动过速的有效护理措施及效果。方法2016年4月-2018年3月本院接诊的阵发性室上性心动过速病患50例,并对其施以静脉药物治疗和(或者)物理治疗,
任继学教授是全国著名中医内科学专家,从医近60载,积累了丰富的临床经验,其临证望、闻、问、切,四诊合参,一丝不苟.强调辨证论治,而不拘于一方一药.近年来注重坏病的研究,认