基于增量模式的文档层次分类研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:youfei741101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文档层次分类中,分类器的自适应调整和阻滞会影响层次分类的精度。为解决上述问题,提出一种基于类别上下文特征的层次分类模型及增量学习算法。根据分类体系,渐进地为每个判决节点建立并维护一个类别相关的上下文特征集,依据文档在上下文特征集中的支持度,找到最可能的层次分类路径和类别。考虑到增量学习的特殊性,将语义相似度引入到路径置信度计算中,以缓解上下文特征集不完备的问题。实验结果表明,相对层次Bayes、层次SVM模型,该算法不仅具有自适应的特性,而且在测试文档集中能提升近8%的分类精度。
其他文献
探究是人类认识世界的一种最基本方式,研究性学习是学生必不可少的学习的最基本形式.学生正是在充满对未知世界的好奇心和探究欲的前提下,在不断的探索发现过程中获得发展,研
文章介绍了合成气压缩机汽轮机调速系统失控,其转速、主蒸汽量及抽汽量突然上升,随后又大幅度下降,导致装置水碳比失调而停车的事故现象。根据汽轮机调速机理、控制元件结构
通过构建PSR模型的指标体系,运用熵权可拓物元模型对河西走廊的土地利用系统健康进行评价。研究结果:2000—2014年这15年期间,根据可拓物元模型经典域取值区间,河西走廊整体土
由于受思维定势的影响,同学们在做题时往往只注意到了表面的形式,而忽视了语言的本质.从表面上看,某种形式可能就是我们非常熟悉的句型结构,其实并不尽然.由于平时对于某种结
关于流动性与收益率的相关性的问题,一直都是国内外学者研究的热点与焦点。在探讨两者相关性时,首先引起专家学者注意的是流动性对收益率存在影响。而近年来,股票收益率对流
双丝焊大大提高了焊接速度和生产效率,并且可得到优质美观的焊缝。国内各焊接研究所和厂家陆续开展相关研制工作。然而,传统焊接电弧电信号采集检测系统往往只适用于单丝焊。本
知识梳理农耕文明是相对于工业文明而言的经济形式。主要以农耕经济为主,手工业和商业是重要补充。它是中国古代的主要经济形式,一直占据统治地位。这一单元,可以分开四大块来进
通过对毛细蒸发相变界面的机理研究,提出了热流对毛细抽吸两相流体回路和回路热管蒸发冷凝界面的影响,推导出蒸发冷凝相变界面的一个新的修正的杨-拉普拉斯方程;采用热力学理
国家实施保障性住房建设工程目的是为中低收入家庭提供住房,高房价催生了部分人利用手中的权力占用多套房进行倒租、倒售;有的地方对保障性任务虚报数字、抵顶任务数;有的房
<正>本文以2015年重庆晨报报道及其呈现的重庆主体形象为样本展开分析。笔者按构造周抽样法~①,随机抽取14天组成2个"构造周",确保上、下半年各有一个构造周,两周报道共计956