改进的Fisher Score和超启发差分进化的特征选择方法研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:chenyi686
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据伴随着人们的生产生活不断涌现,数据量在不断升级,产生的领域也越来越广,且维度也越来越高,这对分析这些数据的有效方法提出了前所未有的挑战,由此产生了“维数诅咒”的概念,特征选择是解决维数问题的有效方法,特征选择开始展现出越来越重要的作用是在上世纪90年代后,各种特征选择方法开始涌现,许多新的方法、新的思路层出不穷,对数据降维技术的发展起到了关键的作用。由Fisher判别演化的Fisher Score是一种计算简单、快捷的特征选择算法,在人脸识别等很多领域表现突出。本文对Fisher Score进行了改进,首先是考虑到了传统Fisher Score在公式上无法完全度量出类间差异,加入考虑不同分布数据特点的思想,其次是在系数上做了调整,使得系数考虑了两类之间的重叠关系,之后又用最大互信息系数做了修正,最后在特征维数较少和较多的两类数据上进行了对比实验,参与比较的包括另外5种过滤准则和原始特征集,实验结果表明所提改进的有效性,即改进的Fisher Score对特征具有更好的辨识力,可以将对分类器来说更重要的特征度量出来。然而,这种过滤式的单变量特征选择方法具有一定的限制,即无法度量特征之间的冗余,同时也会将虽然得分很低却可能对分类很重要的特征排除,于是,本文从特征选择的本质——特征子集的寻优出发,引入了超启发式的搜索方法,将差分进化算法作为高层的启发式指导,设计度量当前特征子集的冗余性的适应度函数进行反馈,对低层设计的10种启发式策略进行选择,由于算法具有回溯性而使得每一次的迭代都考虑了特征的冗余性,最后在14个数据集上进行了对比实验,实验结果验证了超启发式差分进化特征选择算法具有很好的泛化性能,同时,由于高层的启发指导使得低层的启发策略具备了方向性,而在一定程度上减少了启发搜索的随机性。
其他文献
在“互联网+”的背景下,网络电商平台迅速发展,人们的生活习惯也随之发生了改变,越来越多的人热衷于网上购物并在网络平台上发表意见,以表达对产品属性的情感倾向,从而产生源源不断的商品评论信息。在这些数据中往往包含了大量的用户情感因素,如果能有效地挖掘出用户评论的情感信息,这不仅能为商家提供信息反馈,便于商家及时调整销售决策,还有利于社会调查以便政府做出行之有效的对策。因此研究针对商品评论的文本情感分析
低维半导体材料由于其具有高的结晶质量、显著的尺寸效应以及可控的几何结构等特性而被广泛地应用在光学、电学、光电子学器件当中。尤其是低维半导体异质结构由于其内建电场的作用而进一步提高了诸如存储器、激光器和光探测器等的性能。红外探测器在通信、军事和航空航天等领域发挥着重要的作用。低维材料异质结构是实现红外探测器具有小尺寸、高性能、室温探测等特性的有效途径之一。窄带隙材料PbX(S、Se)具有窄的直接带隙
创新是民族振兴与国家富强的必由之路,培养研究生的创新行为更是建设创新型国家的必要基础。而研究生教育作为高等教育的最顶端,学术创新激情普遍不高,一些激发研究生潜在的
开展党史学习教育,要在深入学习领悟党史的同时,坚定理想信念,牢记初心使命,传承红色基因,赓续共产党人的精神血脉,汲取接续奋斗的强大精神力量,在新时代新征程上展现新担当
图像分割是计算机视觉领域的一个重要研究方向,在图像理解中扮演着重要角色。图像分割是指将图像的每一个像素分类,从而将图像分割成若干个具有相似性质的区域。在获取图像的
西安政治学院肩负着研究传播党的创新理论的重要职责,是全军科学发展观教学先进院校。建院35年来,始终高举中国特色社会主义理论伟大旗帜,以强烈的使命意识和高度的理论自觉,
公司法人格否认规则作为一种衡平性规则,在公司独立人格制度更加注重形式的基础上强调了对实质正义的追求,为完善公司独立人格制度提供了重要的支持。2005年我国正式对公司法
新发展阶段需要肩负起新使命的新人。开展党史学习教育,是中国共产党启航第二个百年征程的首次教育,具有划时代的伟大意义。按照习近平总书记的"学史明理、学史增信、学史崇
目的:运用磁共振扩散峰度成像对脑泡型包虫病病例病灶实质区、边缘带(灶周0-10mm)、水肿区及正常对照区进行定量分析,明确病灶及受累周围脑组织范围。方法:收集2018年12月至2019年1月符合纳入标准的脑泡型包虫病病例16例,共30个目的病灶,进行MRI常规平扫、增强扫描及磁共振扩散峰度成像扫描;通过GE adw4.4后处理工作站测量病灶实质区、边缘带、水肿区及正常对照区磁共振扩散峰度成像定量指
人脸识别是多年来经过研究学者的不断探索和创新,快速发展起来的生物识别技术,因为采集人脸样本的过程具有不接触性,友好不侵犯性的特点,能以最自然、最直接的方式获取,人脸