基于贝叶斯网数据挖掘若干问题研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:hantao2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网以其丰富的概率表达能力、灵活的推理能力、综合先验知识的特性及其坚实的理论基础引起科研与应用人员的广泛关注,涌现出大量的基于贝叶斯网模型的数据挖掘方法。本文以基于贝叶斯网的数据挖掘方法中存在的若干研究问题为背景,对分类问题、聚类问题以及增量学习中的概念漂移问题等进行了研究,重点研究基于贝叶斯网的解决方法。本论文的主要内容包括:1)在比较和分析了现有四种经典贝叶斯网分类器的基础上,提出了基于实例选择的贝叶斯网分类器集成算法。该方法选择当前测试实例在训练集中的k最近邻作为验证集,根据各分类器在此验证集上的分类准确性,确定单个分类器的权重,并采用加权投票法进行结果组合,以提高分类准确性;2)针对增量学习中的概念漂移问题,提出一种自适应集成学习算法AMCE,该算法中各个分类器的权重可独立地进行调整,以增强自适应能力;采用剪枝策略对冗余的个体分类器进行约简,以提高集成的泛化性能;提出了基于方向选择的分类器集成算法OSEN,以降低参与集成的个体分类器数目,并提高集成的泛化性能;提出采用遗传算法从当前集成分类器中选择部分个体分类器参与集成,以降低集成的泛化误差;3)针对朴素贝叶斯聚类问题,提出基于离散粒子群的朴素贝叶斯混合聚类算法HDPSO。该算法具有较好的全局搜索性能,并混合EM算法对单个粒子进行局部寻优,以提高算法的收敛速度。通过大量实验验证了本文所提算法的有效性和实用价值。本文的工作预期对国内数据挖掘领域该领域的发展起到一定推进作用,本文对概念漂移数据的分类方法研究方面特色鲜明,具有较高的理论意义和实际应用价值。
其他文献
西江日报讯(记者刘哲通讯员杨来歆李俊)昨日,市委组织部召开部务扩大会议,传达学习党的十七届六中全会精神。$$    市委常委、组织部长黄建勋出席会议并讲话。他要求全体组
报纸
草业机械是发展规模化饲草生产的重要基础。本文结合川西北牧区饲草产业发展现状,针对草业机械设备推广应用中存在的问题,深入一线开展机械设备应用调查研究,为川西北牧区饲
近年来,随着遥感技术的快速发展和遥感应用研究的不断深入,遥感监测正越来越广泛地应用于各地草地退化监测。本研究在地面调查采样分析并结合相关文献的基础上,以植被净初级生产力(Net Primary Productivity,NPP)和土壤有机质(Soil Organic Matter,SOM)为关键指标,利用遥感影像获取色达县NPP和SOM的空间分布数据,利用采样点数据与遥感反演的NPP和SOM空间分
白车身是轿车的关键总成,它决定了整车的力学特性。为了适应汽车节能、降低油耗的发展方向,国内外在汽车车身发展方面紧紧围绕轻量化、提高驾驶舒适性、稳定性及耐用性进行了