基于优化的文档频和Beam搜索的特征选择方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:lhnyzz520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类中,特征空间的维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍现象。为了提高文本挖掘算法的运行速度,降低占用的内存空间,过滤掉不相关或相关程度低的特征,必须使用特征选择算法。首先给出了一个基于最小词频的文档频方法,然后把粗糙集引入进来并提出了一个基于Beam搜索的属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择算法。该算法首先利用基于最小词频的文档频方法进行特征选择,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结
其他文献
利用智能温湿度传感器、8位单片机、键盘数字显示模块控制器构成一种高集成温湿度测量系统,该测量系统具有传感器非线性补偿、温度补偿、自校准以及断电保护现场置入等功能,可用于温度、湿度和露点的精确测量。
采用双层安全炉熔炼镁合金和环壁式除渣法清除结晶器中的氧化皮和夹渣等技术,研制了新型镁合金Mg-Al-Zn-Y光谱标准样品。考察了标准样品的均匀性和稳定性,该标准样品有效期为5
有效和可靠的无线传感器网络重编程技术是解决大规模传感器网络难于管理和维护的重要途径。介绍了无线传感器网络重编程的概念和基本组件,提出了无线传感器网络重编程技术面临
目的:探讨〈10 kg的先天性心脏病患儿术后呼吸管理的方法和经验。方法:收集2004年2月至2012年8月收治的106例体重〈10 kg的先心病患儿在全麻低温体外循环下行畸形矫正术的临床
针对非平稳的数字调制信号,构造新的高阶交叉累量特征;利用神经网络的学习机制实现自适应模糊推理调制识别器的非线性动态建模;采取分层决策的级联结构,提高了特征与识别器的契合