一种基于加权的ID3改进算法

来源 :第十九届全国网络与数据通信学术会议 | 被引量 : 0次 | 上传用户:myna5726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在机器学习领域中,决策树是一个很重要的问题.决策树作为一种工具已经应用在了很多领域中.虽然对决策树的研究已经十分广泛,但是在决策树的分类算法中仍然存在一些不足之处,例如使用信息增益作为分类准则会造成“多值偏向”问题的出现.在决策树算法中,ID3算法就是一种基于信息增益的算法,它作为决策树的核心算法,可以扩展到其他决策树算法中去.为了优化决策树分类算法,这篇文章提出了一种对于ID3算法的新型决策树分类扩展算法,称为ID3-α.ID3-α引入一个特别的权值来平衡属性值对于数据的不平衡程度.实验表明这种新型的算法在分类问题上的表现要比ID3算法精确,并且这种加权思想也可以用在其他决策树算法中.
其他文献
随着改革开放的不断深入,电话作为一种信息交流,通讯联络的重要通信工具,已成为传播疾病的一种不可忽视的媒介。为此我们进行了90部电话机细菌学指标调查,现将结果报告如下:
1991年6月,我们受澳大利亚辐射实验室(Australian Radiation Laboratory ARL)邀请,参加了由IAEA委托ARL组织的亚太地区个人剂量比对,这次比对有16个国家和地区37个实验室参
  OpenFlow技术通过分离网络的数据平面和控制平面,为网络创新提供了平台和工具。基于OpenFlow管控分离的架构,本文在控制器NOX上进行软件编程,设计实现了多功能的DHCP(Versat
目的:探讨PDCA循环法联合6S管理模式在EICU噪声管理中的应用效果.方法:收集2018年10月本院EICU的噪声强度作为干预前数据,从2019年1月开始实行PDCA循环法联合6S管理模式,收集
1993年第七届全运会、1997年第八届全运会、2001年第九届全运会,山西古典式摔跤队员韩玉伟均获冠军,被同行誉为摔跤界难得的三连冠王。韩玉伟说,他最好的成绩应算1995年在布
  近年来,基于格的密码体制受到越来越多的关注.这类密码具有诸多潜在优势:抗量子攻击、并行性好、概念简单、安全性所基于的困难问题的随机实例难解性等价于格上公认困难问
水产“芯”动力,种业创未来.12月4日,作为首届中国水产种业博览会同期活动之一的中国水产种业质量提升高峰论坛在广州举行.中国工程院院士麦康森、刘少军,南海水产研究所所长
期刊
本文从两个方面讨论IUD和宫外孕的关系。根据4项放置IUD的多中心研究资料(随访5年),其宫外孕的发生率为0.4~1.02/1000妇女年,与国外文献报道相似。惰性金单环和带铜V和T型IUD
  主机标识协议(Host Identity Protocol,HIP)通过使用公钥作为主机身份标识符,解决了由IP地址同时标识身份和位置而引发的难题。针对HIP实际部署应用的相关问题,设计实现
会议
齐鲁石化公司为特大型石油化工企业,设10个生产厂和5个二级公司。现有放射工作人员168名;放射性同位素6种(总活度为6.4×10~(11)Bq);射线装置72台。近几年来,围绕如何将放射