【摘 要】
:
随机森林算法在数据挖掘领域中得到了广泛的应用,该算法通过构建多个不同的决策树可以获得更高的分类结果。但是,随着数据规模的增大,人们开始接触到各大规模的数据以及更高
【基金项目】
:
江苏省现代教育技术研究2012年度课题(2012-R-21903)
论文部分内容阅读
随机森林算法在数据挖掘领域中得到了广泛的应用,该算法通过构建多个不同的决策树可以获得更高的分类结果。但是,随着数据规模的增大,人们开始接触到各大规模的数据以及更高维度的数据属性。传统的随机森林构建算法不能有效、快速地处理海量高维数据,严重影响了数据的分类效率,从而影响预测效率。本文针对高维、海量数据下随机森林构建算法,改进并提高了该算法的效率,提出了基于云计算平台的随机森林构建算法。该算法可以快速的完成数据分类预测,并通过实验结果进一步展示了该算法的效率以及可扩展性。
其他文献
加快农村水利基础设施建设,解决农村饮用水安全问题,是保障农民身体健康、促进农村经济发展、建设社会主义新农村的重要内容。为了深入了解洪江市农村饮用水现状,笔者对全市
以三折线线性软化模型为基础,结合Tresca屈服准则和不相关联的流动法则,同时考虑了塑性区弹性变形,推导了具有应变软化和剪胀特性的土体球孔扩张问题的解。运用所得解分析了不同
2014年以来.随着鄂尔多斯电力冶金公司PVC项目的投产.特别是5月鄂尔多斯市君正能源化工有限公司和内蒙古中谷矿业有限责任公司纳入规模以上工业后.该市PVC、烧碱等化工产品产量
早在1992年颁布的《九年义务教育全日制小学、初级中学课程计划(试行)》中,一种新的课程类型——活动课程首次被列入课程计划,并明确规定“本课程计划设置晨会(夕会)、班网队活动、
气象条件是诱发脑溢血的因素之一,可根据气象条件变化对脑溢血发生的机率进行预测,但发生脑溢血疾病是一种小概率事件,气象条件与脑溢血发生具有不确定性的特征。本文引用集对分析中联系度概念,对影响脑溢血发生的气象预测因子进行同异反分析,建立了基于集对分析的脑溢血发生预测方法。历史拟合和业务试用表明,这一方法有较好的效果。
本文针对开放教育数据结构课程的教学实践,基于教学空间理论,设计了课程体系子空间、教学内容子空间和学习交流子空间,在教学空间中引导学生明确数据结构在计算机学科体系中的重
高职学生在成为职业人时应该具备从事职业活动的能力,这种能力来源于他们自己的职业心态、职业道德、职业技能和职业形象素质,这四项职业素质的形成过程即职业化修炼的过程。根
<正> 《宗统编年》,三十二卷。清康熙二十八年(1689),常州府武进县祥符寺沙门纪荫撰。收入日本编《续藏经》第一四七册。书首有康熙三十二年(1693)纪荫的进奏;刊板者许之渐(
无线传感器网络WSN的路由存活概率云计算模型的优化设计可以提高WSN网络的网络复杂和数据吞吐量,在WSN网络的路由发射功率能耗具有匹配衰减特性,路由存活概率优化困难。传统方
根据《语文课程标准》精神,小学语文教材在选文上要坚持三种价值取向:文化性、时代性、审美性。但是,在课堂上,孩子们往往会从与大人不一样的角度,另眼看课文。 课文插图的准确性 “挑山工走路的姿势画对了吗?” 学《挑山工》这篇课文时,学生发现:课文介绍挑山工登山时为减缓坡度和避免物件触到台阶,要走折尺形路线。可插图上画的是—个挑山工挑着担子走直线登山的背影。 我表扬他观察很细致,是个伟大