基于KNN的多要素文本协调分类算法

来源 :现代计算机:上下旬 | 被引量 : 0次 | 上传用户:xtzzll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类能够帮助人们更有效地利用不断膨胀的海量网络信息,然而网络文本中已不再是以单一的文本内容形式出现,更多的是包含标题、关键字、摘要、正文等多种要素。若用传统的文本分类器,则效果明显不好。综合利用文本各要素,提出通过KNN算法对各要素进行文本分类,再使用模拟退火算法以及Baves定理协调各要素比重的多要素文本协调分类算法。实验结果表明,该算法是可行的,并且使用该算法得到的分类器比仅使用文本内容得到的分类器具有更高的分类准确率,
其他文献
帧内预测的主要目的是消除相邻像素间的空间冗余.通过邻近块中已解码图像的像素块来预测当前块。介绍H.264帧内预测的基本原理和算法步骤.对现有的改进方法进行深入的探索和分析
针对非计算机专业学生学习Visual Basic课程兴趣不高而造成教学目标难以有效达成的问题,提出运用类比法讲概念、巧设认知冲突悟新知、精选趣味案例乐中学的教学思路。在教学实
农村信贷市场需求旺盛,农村信用社不良贷款占比较高,影响了其它涉农金融机构的投放信心,信贷投放量日趋萎缩,阻碍了农村经济结构调整的步伐。建设优良的农村信用体系,有利于
结合教学经验,从转变教学思想、改进教学方法、强化实验等方面对军队院校《计算机软件技术基础》的教学做初步探讨。实践表明,该做法激发学员的学习兴趣,增强学员分析问题、解决
分析PPP中PAP与CHAP两种认证方法的原理及认证工作过程。利用实际例子实现PAP与CHAP两种认证方法的单向认证、双向认证,并给出具体操作方法。给出验证PAP与CHAP认证是否成功的
为了解决本地生物抗逆基因数据自动获取以及生物抗逆基因数据库资源管理及检索的需求,在已有的通用公共数据库资源数据的抗逆基因数据库数据模型基础上进一步扩充,实现抗逆基
根据N-GPS标准和平面度误差检测国家标准GB/T11337—2004,提取平面度误差评定的基本概念和规则信息,通过使用OWL语言来描述平面度误差评定知识。设计平面度误差评定本体的架构,基
推进农村金融产品和服务方式创新是新形势下深化涉农金融机构改革,加强和改进涉农金融机构服务水平,促进信贷结构优化调整的有效途经,对于支持和推进社会主义新农村建设具有重要
目的:观察羊膜移植在宫腔镜下宫腔粘连分离术(TCRA)术后预防宫腔粘连(IUA)的疗效,以评价羊膜移植对IUA的价值。方法:选取2013年1月至2015年6月我院收治的中重度IUA患者90例,随机分
<正>我国稻区新稻谷多用日晒干燥,阴雨、台风、晒场缺乏或农事繁忙等常引起霉变、发芽和发热而造成较大损失,据调查:浙江省湿稻谷因不能及时干燥引起的损失一般为2%—8%,严重年