一种基于VSM文本分类系统的设计与实现

来源 :华中科技大学学报:自然科学版 | 被引量 : 0次 | 上传用户:wx1980_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现,包括对该系统的结构、预处理、特征提取、训练算法,分类算法等关键技术的介绍.通过引入结构层次权重系数来改进文本特征项权重,同时提出一种新的训练算法和文本相似度域值计算方法.实验结果证明:该分类系统能有效地提高文本分类效果,开放性测试的平均准确率在80 %以上,且平均查全率达到了86%.
其他文献
黄曲霉毒素B_1标准溶液的制备和定值雷霆,郝希成(国内贸易部谷物油脂化学研究所,北京)黄曲霉毒素B_1(AflatoxinB_1,AFFB_1)是生长于粮食及饲料上的黄曲霉菌和寄生曲霉菌的次级代谢产物.数十年的研究已经证实,黄