中文文本分类中特征提取方法的比较与改进

来源 :兰州工业高等专科学校学报 | 被引量 : 0次 | 上传用户:yangtianmei01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前有多种特征提取方法用于文本自动分类,其中CHI方法效果较好,研究发现CHI方法存在着词与类别的无独立性假设及计算复杂度高等缺点,提出一种改进了的CHI方法ICHI(ImprovedCHI),通过分类实验仿真数据显示,在SVM与KNN分类中这种改进后的特征提取方法ICHI特征提取效果优于传统的CHI方法,改进后的方法ICHI能提高文本分类的准确率,适合局部特征提取.
其他文献
利用Schrodinger算子核的估计得到了Ttf(x)=e^-tLf(x),t〉0在Morrey空间上的有界性.其中L=-△+V,位势V(x)满足反向Holder不等式,▽是拉普拉斯算子.
红法夫酵母可产3-羟-3',4'-二脱氢-β,ψ-胡萝卜素-4-酮,经多次诱变和HDCO生成条件研究,HDCO产率由原来的30μg/g(细胞干重)提高至510μg/g(细胞干重),HDCO占P.rhodozyma所产总类胡萝卜素含量由8%提高到45%,还对促进和制抑制HDCO生成因子及可能的
针对传统否定选择算法存在的问题,提出一种新的基于否定选择的检测器生成算法,通过使用模板来消除冗余的检测器,从而提高系统监测效率.实验表明,该算法能够尽可能多的覆盖“非我”
建设法治政府是坚持依法治国执政方略的重要内容,也是提高政府素质的必然要求.同时,它将通过打造服务型政府、有限政府、责任政府、高效率政府和诚信政府,全面提高政府素质.
为了研究桥头跳车问题,对采用双向土工格栅加筋与短搭板相结合的方法在武汉阳逻长江大桥接线上进行了实体工程试验研究,对桥头加筋和没有加筋路堤的分层沉降和地基沉降,以及路堤
为了提高主动信息安全过滤的质量,将网络底层过滤技术和基于内容的安全过滤相结合,并以常规的两层过滤模型为基础,构建了一个多层次多策略的主动信息安全过滤模型,该模型可以
利用PoweBuilder可视化开发环境,基于MapX的GIS组件技术和Oracle数据库设计开发了小区物业管理信息系统,给出了系统主要功能以及部分图形功能的实现技术,介绍了系统的主要功能界面.
2005年以来,兰州住房公积金管理中心(以下简称中心),在中共兰州市委、市政府的正确领导下,在上级监管部门的大力支持下,坚持邓小平理论和“三个代表”重要思想,认真贯彻党的十六大精
旅游景点莫高窟、鸣沙山、月牙泉、阳关、玉门关、渥洼池、亚丹地貌等。
利用郑兵和R.B.Bapat建立的矩阵外逆阶的一个特征,给出直接运用矩阵的予阵表示和计算矩阵广义逆AT,S^(2)的一种新方法.