一种基于VSM文本分类系统的设计与实现 - 论文文献免费下载 - 皮皮文库

一种基于VSM文本分类系统的设计与实现

来源 :华中科技大学学报：自然科学版 | 被引量 : 0次 | 上传用户：wx1980_2009

【摘要】

：

阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现,包括对该系统的结构、预处理、特征提取、训练算法,分类算法等关键技术的介绍.通过引入结构层次权重系数来

【作者】

：

李凡林爱武陈国社

【机构】

：

华中科技大学

【出处】

：

华中科技大学学报：自然科学版

【发表日期】

：

2005年3期

【关键词】

：

文本分类向量空间模型特征提取结构层次权重系数训练算法分类算法 text categorization vector space model fea

【基金项目】

：

国家高性能计算基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现,包括对该系统的结构、预处理、特征提取、训练算法,分类算法等关键技术的介绍.通过引入结构层次权重系数来改进文本特征项权重,同时提出一种新的训练算法和文本相似度域值计算方法.实验结果证明:该分类系统能有效地提高文本分类效果,开放性测试的平均准确率在80 %以上,且平均查全率达到了86%.

其他文献

RP2基因的定位与DNA序列分析

期刊

DNA序列分析基因突变连锁分析人类基因组染色体位标色素沉着基因定位基因诊断视网膜色素变性遗传学研究

中国汉族人群低密度脂蛋白受体基因多态性及其单体型分析

期刊

多态性中国汉族人群单体型分析受体基因脂蛋白低密度基因诊断外显子暨南大学生物工程系

中国赫哲族体质人类学研究

期刊

赫哲族纯系血缘体质特征

妊高症患者leptin基因启动子多态性序列功能分析

期刊

多态性妊高症功能分析基因启动子LEPTIN妊高征基因表达水平启动子序列发病机制暨南大学

黄曲霉毒素B＿1标准溶液的制备和定值

黄曲霉毒素Ｂ＿１标准溶液的制备和定值雷霆，郝希成（国内贸易部谷物油脂化学研究所，北京）黄曲霉毒素Ｂ＿１（ＡｆｌａｔｏｘｉｎＢ＿１，ＡＦＦＢ＿１）是生长于粮食及饲料上的黄曲霉菌和寄生曲霉菌的次级代谢产物．数十年的研究已经证实，黄

期刊

黄曲霉毒素寄生曲霉菌和定国内贸易部油脂化学次级代谢产物国家计量认证污染监测国家计量局检测机构

用PCR方法分析内蒙古蒙古族人群ACE基因多态性

期刊

蒙古族人群ACE基因PCR方法内蒙古地区基因型频率血管紧张素Ⅱ等位基因频率内蒙古医学院内蒙地区基因多态性

橄榄桥脑小脑萎缩(Mezhel型)一家系

期刊

橄榄桥脑小脑萎缩先证者家族性遗传病桥小脑角显性遗传病遗传型染色体检查常染色体第四脑室

rhTPO对人外周血淋巴细胞染色体畸变试验

期刊

淋巴细胞染色体畸变染色体畸变试验人外周血淋巴细胞RHTPO分裂指数人二倍体细胞血小板生成素秋水仙素生长抑制试验安全评价

AT<sub>1</sub>R基因3’-末端CA重复序列多态性与藏族原发性高血压相关联

期刊

原发性高血压CA重复序列多态性医学分子生物学国家重点实验室中国医学科学院基础医学研究肾素-血管紧张素系统R基因藏族人群受累同胞对

运动能力的遗传研究方法

期刊

运动能力遗传研究染色体异态性双生儿遗传力运动员选材选材法人体运动能力性别鉴定性染色体

其他学术论文