一种基于特征提取的二级文本分类方法

来源 :广东工业大学学报 | 被引量 : 0次 | 上传用户：uuuuurzm

【摘要】

：

提出了一种改进的基于特征提取的二级文本分类方法.通过提取出文本的特征项并计算其权重值,将文本表示成由特征项和权重值组成的向量,利用向量的夹角余弦计算二级分类模型下

【作者】

：

邹丽娜凌捷

【机构】

：

广东工业大学计算机学院

【出处】

：

广东工业大学学报

【发表日期】

：

2012年4期

【关键词】

：

文本分类特征提取向量空间模型 KNN算法 text classification feature extraction vector space mod

【基金项目】

：

广东省教育部产学研合作资助项目（2011A090200068）, 广东省自然科学基金资助项目（9151009001000043）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了一种改进的基于特征提取的二级文本分类方法.通过提取出文本的特征项并计算其权重值,将文本表示成由特征项和权重值组成的向量,利用向量的夹角余弦计算二级分类模型下文本之间的相似度,可以更准确快速地定位海量信息.实验结果表明本文提出的分类方法的准确率优于传统的类中心分类法,提高了系统的适应性和分类能力.

其他文献

简析高校网络攻击及网站防篡改解决方案

随着高校教育信息化的不断深入开展。高校的网络安全问题日益突出，许多高校网站遭受到不同程度的篡改。文章针对高校网络存在的上述问题，提出了相应的安全防范措施和解决方案。

期刊

高校网络攻击网站防篡改Barracuda-NC应用防火墙

新型粉体静电消除器的设计研究

　　在粉体静电消除器上，引入一种新的控制栅极，可以很好地控制消电效率。控制栅极为一圆柱形金属箔，粘贴在PVC管道内壁。通过控制栅极电压的极性来提高消电效率。本文对智能型

期刊

粉体静电消除器控制栅极消电效率反馈调节

选择性五羟色胺回收阻断剂所致的性功能障碍及其临床处理

<正> 传统的三环类和四环类抗抑郁剂因为副作用较大和致死量较低的缺点而逐步让位于选择性五羟色胺回收阻断剂(SSRIs)。这类抗抑郁新药不但疗效可以完全与传统的抗抑郁剂比美

期刊

五羟色胺回收阻断剂性功能障碍临床处理

浅谈提高造林绿化质量的关键

要根治水土流失，恢复植被，绿化山川，改善生态环境，实现人与自然和谐，就要全面落实科学发展观，抓好造林绿化工作。以建设林业生态县为主攻方向．以构建和谐社会为目标，坚持高标准常年抓

期刊

科学性提高造林绿化

手淫一词应变革

<正> 多年来,手淫一直是性学领域中争论不休的问题。过去,认为手淫可导致可怕的后果,包括精神失常和死亡……在英国中世纪,就有专门设计的素食谱来代替肉食的配方以抑制性欲,

期刊

手淫变革性学术词

谈谈案例在《经济法》教学中的运用

在《经济法》教学中应用案例教学,可根据授课内容选择典型案例;根据学生掌握相关知识的深浅,精析或简析案例;根据案例内容,把握应用时机;让学生自己选择和分析案例;根据案例

期刊

经济法案例选择应用

加强质量管理树立企业形象

本文主要对在建工程的质量管理进行了详细的阐述，对施工现场质量管理的方方面面进行了有益的总结．并对施工质量管理提出了自己的看法。

期刊

质量管理监控

一种基于特征提取的二级文本分类方法

其他学术论文