【摘 要】
:
本文以数据挖掘中的分类问题为研究对象,对数据挖掘中常用的数据分类进行了对比,深入研究了决策树分类模型,重点对ID3算法和现有的几种算法进行了分析和研究。理论上分析了ID
论文部分内容阅读
本文以数据挖掘中的分类问题为研究对象,对数据挖掘中常用的数据分类进行了对比,深入研究了决策树分类模型,重点对ID3算法和现有的几种算法进行了分析和研究。理论上分析了ID3算法多值偏向的原因,引入OneR算法中的分类错误率对信息增益公式进行了改进,解决了ID3算法的多值偏向问题。针对ID3算法中的对数运算量大,计算效率不高等问题,本文采用多项式函数近似的方法,避开了大量的对数运算,提高了ID3算法的计算效率。另外以商务购车顾客数据库上的数据集为例进行决策树构建实验,结果表明基于错误率的信息增益生成的决策树更符合客观实际,叶子节点数更少,决策树更加简洁。同时在UCI数据库中的四种数据集上进行数据分类实验,结果表明改进后的算法生成的决策树分类的准确率更好,计算效率更高,叶子节点数更少;在相同数目的样本数据集下,改进后的算法构建决策树时花时间更少。
其他文献
就粉末活性炭和大孔树脂对苯酐酸水的脱色效果进行了研究。首先考察了活性炭种类、脱色时间、活性炭用量等因素对脱色效果的影响,结果表明在优化后的条件下其对苯酐酸水的脱
通过TGA对煤沥青的热失重过程进行了研究,分析了煤沥青的热解缩聚特征,并对中温沥青和性质沥青热解缩聚行为进行了比较,研究了升温速率对煤沥青热解缩聚的影响,发现快速升温
目的:研究Er:YAG激光联合3M ESPE Adper Easy-one自酸蚀树脂粘结剂堵塞牙本质小管的效果,为其治疗牙本质敏感提供实验室依据。方法:选择因正畸需要拔除的牙体完整、无龋损的
随着全球经济一体化的不断推进,尤其我国加入WTO后,国际贸易日益频繁,经贸英语的翻译问题也越来越显得急迫与重要。本文结合经贸英语的相关特点,提出了经贸英语在翻译过程中
网络的出现为媒介批评的发展带来了重大机遇,网络的自由性和开放性,使多元意见得到表达,网络成为媒介批评的新阵地。网络媒介批评越来越受到重视,但也面临诸多挑战,需要采取
随着计算机技术的不断发展和信息产业的不断壮大,机电一体化机械系统的设计和研究也需要借助电子技术而得到进一步的飞跃。与传统的机电产品相比,机电一体化产品的问世将极大
为了揭示生物质炭输入对稻田根际土壤产甲烷和甲烷氧化活性的影响,该文通过1a的田间试验,研究了2种原料制备的生物质炭(竹炭和水稻秸秆炭)对水稻根际土壤产甲烷和甲烷氧化活
<正>随着课程改革的深入,音乐课堂教学的有效性成为音乐教育教学关注的集点,所谓有效是指教师在一定时间的教学后,学生所获得的进步或发展,有效教学理念的核心是更好,让学生
<正>煤焦油是炼焦厂的副产品,所以煤焦油的产量也随着焦炭的产量增加而增加。近几年我国钢铁工业的快速发展,对焦炭的需求量猛增,2006年我国