基于蚁群优化的决策树算法研究与应用

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:ytfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树算法是机器学习领域具有代表性的算法之一,具有分类速度快、精度高、生成过程简单以及产生的规则易于理解等优点,已经被应用到数据挖掘、风险评估等领域。但是决策树算法也存在着对噪声敏感、在测试属性选择时倾向于选择取值较多的属性等缺陷。蚁群算法是一种高效的仿生算法,它以模拟蚂蚁的觅食行为而得名,具有信息素反馈、启发式搜索和分布式计算等特征,与其它算法结合,可以得到性能卓越的优化算法。许多研究人员尝试利用蚁群算法来对决策树算法进行优化,并提出了许多性能卓越的改进决策树算法,比如分类回归树算法(CART, Classification And Regression Tree)。该算法性能非常优秀,生成的决策树的预测精度高,但是也存在一定的不足:一是只适用于连续属性;二是没有充分利用蚁群算法中的启发信息特征。本文提出了一种新的基于蚁群优化的改进决策树算法(ACODT, Ant Colony Optimization Decision Tree),该算法将蚁群算法应用于决策树生成过程,充分利用了蚁群算法信息素反馈和启发搜索的特点,降低了决策树的规模,优化了决策树的生成过程。在决策树属性分支选择时,改进算法采用将信息素反馈特征和信息增益比结合的方法代替了CART算法中采用的基尼指数方法,提高了属性分支的准确性。在利用蚁群算法搜索最优解的过程中,改进算法又借鉴了最大最小蚂蚁算法中采用的信息素更新方法,增强了算法搜索最优解的能力,提高了生成的决策树的预测精度。为了验证改进算法的性能,本文设计了两个实验:一是从UCI数据集中选取了15个经典数据集,采用C4.5和CART两个算法进行对比实验;二是设计并实现了基于蚁群优化的改进决策树算法的入侵检测系统,选择KDD CUP99作为实验数据集,采用C4.5算法进行对比实验。实验结果表明,改进算法能够有效提高决策树的预测精度,降低决策树规模,增强可理解性。
其他文献
圈条器是并条机的重要机构。随着并条机的高速化,圈条器的设计日益引起人们的重视。文章主要对高速并条机的圈条器进行了深入的研究。分析了圈条速比、偏心距等参数对条筒容
综述了白果槲寄生的化学成分及药理活性,揭示了其广阔的临床应用前景
目的掌握北京市延庆县重点人群(育龄妇女和孕妇)碘营养状况,为制定合理防治碘缺乏和碘过量引起的疾病提供科学依据。方法在延庆县医院和社区中随机抽查20~40岁育龄期妇女205
目的:观察针刺五神穴治疗腑滞浊留型血管性痴呆的临床疗效。方法:将129例腑滞浊留型血管性痴呆患者随机分为基础治疗组、传统针刺组和针刺五神穴组,每组各43例。基础治疗组进
2016年12月1-2日,欧洲航天局(ESA)部长级会议在瑞士卢塞恩召开,会议签署了4项决议,内容涉及ESA的战略、预算和计划3个层面,为整个欧洲航天领域的未来发展指明了方向。
我国目前城市经营思想中的狭隘利益观导致了一系列问题的产生。城市经营作为现代化城市发展的城市政策,应具有整体性和综合性。整体性城市经营理念以广义的城市资源为对象,以
姓氏作为人的符号已经有几千年的历史。它是人们社会实践的必然产物,是生产力发展到一定程度所表现出来的一种社会文化现象。它的产生、演变、发展都有极其复杂的历史和社会
随着世界经济的全球化与一体化,人类利用自然资源能力的增强,跨国环境侵权事件日益频发,如何妥善处理跨国环境侵权事件已经成为全球关注的热点问题。目前,世界各国对此问题正
2019年12月11日,由中国热带农业科学院(下称:中国热科院)、海南省林业局等单位主办,中国热带农业科学院椰子研究所、海南椰子产业联盟等单位承办的“2019海南(国际)椰子产业
目的 探讨穴位埋线结合火罐治疗单纯性肥胖症的临床效果。方法 选择单纯性肥胖症患者60例为研究对象,随机分为观察组30例,予以穴位埋线结合火罐进行治疗;对照组30例,单纯予以