【摘 要】
:
分类是数据挖掘中的一项重要工作内容。在常用的分类方法中,马田系统因基于数据进行分析而不需要对数据的分布进行假设,并且能够有效进行特征变量的筛选,真正意义上达到降维
论文部分内容阅读
分类是数据挖掘中的一项重要工作内容。在常用的分类方法中,马田系统因基于数据进行分析而不需要对数据的分布进行假设,并且能够有效进行特征变量的筛选,真正意义上达到降维的目的,而在许多领域得到应用。本文主要对马田系统中两类别分类问题进行研究。主要的工作有以下的两点:(1)基于粒子群算法的马田系统两类别分类方法研究传统的马田系统在进行特征变量的筛选时,是使用正交表和信噪比方法来实现的,但一些学者研究的表明:在进行特征变量选择时,使用正交表和信噪比并不一定是最佳的方式。本文研究基于粒子群算法的马田系统分类方法(基于平衡数据),构建优化模型,将粒子群算法与马田系统方法进行结合,用粒子群优化算法对特征变量进行选择,使其更好的用于平衡数据的分类问题中。(2)基于集成思想的马田系统不平衡数据分类研究在现实生活中,不平衡数据分类问题普遍存在,不平衡问题是指分类类别样本量有显著的差异,而同时少数样本类往往是人们所关注的。传统马田系统在对不平衡问题进行分类时,分类的正确率会受多数类样本的影响,而使得结果倾向于多数样本类,导致忽视了少数样本类正确率的重要性。本文针对传统的马田系统方法未考虑数据不平衡因素的影响,提出将优化思想、集成的思想与马田系统相结合,以提高不平衡数据分类效果为目标,构建优化模型,用以对马田系统进行改进,使其更好的用于不平衡数据分类问题。
其他文献
从“一辆自行车、一块砧板、一杆秤”做起,到办屠宰场,开餐馆,再到坐拥世界一流旅游集团,苏志刚心里一直有个原则,“要么不做,要做就做最大最好的。”世上有两种人,一是扮虎吃猪,一是扮猪吃虎,苏志刚显然属于后者。 在广东,有些方言很传神,比如“口水多过茶”和“扮猪吃老虎”。长隆集团创始人苏志刚显然属于后者。 即便带领长隆成功跻身世界主题公园集团前十强,苏志刚依然自称是一个“只有小学文化的农民”。面对
【摘要】目前,随着教学事业不断的在发展之外,我们的教学方法也应该得到长足的进步。在小学时代,学生们的自主学习意识不强,对枯燥的学习方法没有概念,所以采取游戏的教学方法将事半功倍,让学生们在快乐的游戏中学到真正的英语知识,这就是游戏教学的方法的好处。小学生的英语如何学习到位,如何既不枯燥又能在欢乐的游戏中接受英语的学习,这都是很大的挑战,所以,本文论述了英语教学中,小学生游戏学习方法的几点好处以及正
制造业作为典型的传统产业之一,是我国国民经济的支柱产业。在全球经济背景下,制造产业整体的技术能力、创新水平与产品质量都有了显著提高,然而由于一些中国制造的产品在国际市
目的:探究急性脊柱创伤的临床诊断和切开减压椎弓根内固定术的有效性.方法:选取2016年1月---2017年1月来我院就诊的急性脊柱创伤患者50例为研究对象.对所有患者行核磁共振,X
目的:分析手术室行PDCA循环管理法对提升医生与护士合作满意度的影响.方法:选择本院于2015年3月-2018年3月间收治的80例手术室患者为研究主体.分为A组和B组,均为40例.A组给予
近几年来,以互联网为代表的计算机信息技术迅速普及,传统商业数据已逐渐向网络积累。网络商品交易的数据能通过数据挖掘的方式合理利用并为企业决策和战略发展服务。数据挖掘在
目的:使用超声生物显微镜对剖宫产不同缝合方式形成瘢痕的对比研究.方法:选取2014年1月至2016年1月期间在我院妇产科进行足月剖宫产手术者200例,其中使用无针缝合器者100例为
本文用数据包络分析的方法 ,对 1993— 1997年间的信息技术产业与其相关产业的全要素相对生产率进行分析评价
In this paper, using data envelopment analysis, the total
目的:比较分析腹腔镜手术以及开放性手术治疗结直肠癌患者的效果.方法:选取2011年1月~2018年3月在我院进行诊治的85例结直肠癌患者,随机分为两组.对照组采用开放性手术,观察组
目的:分析干扰素对慢性病毒性肝炎(CH)合并肝源性糖尿病(HD)的治疗效果及对alt变化、空腹血糖水平的影响.方法:选择本院于2015年3月-2018年3月间收治的80例CH合并HD患者为研