一种增量式Bayes文本分类算法

来源 :南京师范大学学报:工程技术版 | 被引量 : 0次 | 上传用户:A491858248
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动分类是数据挖掘和机器学习中非常重要的研究领域.针对难以获得大量有类标签的训练集问题,提出了基于小规模标注语料的增量式Bayes文本分类算法.该算法分两种情况处理:第一种情况是新增样本有类标签,可直接重新计算样本属于某类别的条件概率.第二种情况是新增样本无类标签,则利用现有分类器为其训练类标签,然后利用新样本来修正分类器.实验结果表明,该算法是可行有效的,比Nave Bayes文本分类算法有更高的精度.增量式Bayes分类算法的提出为分类器的更新提供了一条新途径.
其他文献
多年前,在一片荒山野岭中建起了一座大型企业,鼓舞了一批批怀揣着梦想的“江峡人”,挥洒汗水。从第一台柴油机的生产,到如今自主研发拥有自己的产品;从军品逐步转向民品,从小到大,从无到有,由弱变强,一步一个脚印,实现了“军民融合,全面发展”的良性互动,走上了一条科学发展、快速发展的“追梦”道路。  历史与使命  宜昌江峡船用机械有限责任公司(代号404厂),始建于1970年,是国家上世纪70年代初投资兴
无线激光打靶器利用对信号的编码和解码来实现靶与枪的分离.即采用数字脉冲编码方式对控制系统信号进行调制,将信息加载在光脉冲序列上发射出去.光信号经过大气和光纤的传播,
根据机械制造工艺语言的特点,在机械制造工艺汉英自动翻译系统中,对汉语工艺语言的词语进行了合理地分类,并建立了词类判别的数学模型.同时,简单介绍了工艺语言识别和处理的
近几年,在《失控》、《零成本社会》、人工智能、互联网企业崛起、创新蝴蝶效应连片展现等风暴眼的激发下,企业界纷纷热议未来的企业到底会不会走上失控化自组织发展之路。同时在重返亚太、“一带一路”、大欧元区再整合、北极再开发、上帝粒子探索、人脑基因图谱组、全球治理等大事件及其背后思维范式的启发下,我们在思考,企业是不是要走顶层设计和顶层管理之下的管控化有序组织发展之路。  社会思潮对管理的影响从来没有像现
在纪念中国人民抗日战争暨世界反法西斯战争胜利70周年阅兵中,中国电子科技集团公司第十四研究所(以下简称“14所”)共有7型装备接受检阅,7型装备分别是空警2000预警机、机动三坐标雷达、履带式自行高炮雷达、歼-10、歼-10A、歼-11、歼-15机载火控雷达。在这次的阅兵式上,周万幸所长带着14所5000职工的军工梦想在现场见证了一场空前瞩目的国防盛典。  空警-2000领航起飞,将誓言写上了蓝天
目的:探讨护理风险管理在住院精神病患者安全管理中的应用。方法:选取2018年6月至2019年1月在本院精神科治疗的精神病患者53例作为对照组,予常规精神病患者护理干预;选取2019