【摘 要】
:
随着数据库技术的发展和数据库管理系统的应用,海量信息以不同数据形式被存储起来。数据挖掘就是为了获取这些数据中有价值的信息而发展起来的一种数据处理技术。数据的属性
论文部分内容阅读
随着数据库技术的发展和数据库管理系统的应用,海量信息以不同数据形式被存储起来。数据挖掘就是为了获取这些数据中有价值的信息而发展起来的一种数据处理技术。数据的属性并不是同等重要的,甚至某些属性是冗余的。因而,精炼数据库的属性集(属性约简)成为数据挖掘技术的一个重要环节。本文通过规则知识的形式化描述,提出了确定性知识与核心示例集的概念,结合决策树算法提出了基于核心示例集的决策树属性约简方法,主要工作如下:(1)本文对决策树算法的本质特点进行了研究,在将规则知识形式化的基础上,提出了确定性知识与核心示例集的概念,并证明了规则知识不变性;(2)结合决策树算法,以核心示例集的不变性为理论基础,提出了决策树的属性约简方法与核属性求解方法;(3)在非协调环境下,揭示了决策树通过强制拟合使节点纯度不为1,在确定性知识与核心示例集的概念的基础上提出了β-确定性知识和β-核心示例集,并依此建立了基于β-核心示例集的决策树属性约简方法。结合具体实例,分析了这些方法的特征与性能,结果表明,它们都具有较强的可操作性,可以有效地处理不同类型数据库的约简问题。
其他文献
为调查重性精神障碍患者陪护家属的心理健康状况,采用自编问卷和症状自评量表(SCL-90)进行调查,对数据进行统计分析,结果发现重性精神疾病住院患者陪护家属的年龄、文化程度、与
智能车是当前的一个研究热点,许多汽车厂商与IT行业重资投入并取得了一定的进展,但其理论与技术是保密的,因此对智能车的理论与技术研究仍具有重要意义。由于路况的复杂性,实现完
如下这条新闻算得上是杧果腌制达人的福音。印度国家农业研究院和圣雄普莱农业大学的专家学者们历时7年,培育出腌制专用的杧果品种,其保存期可达一年之久。研究人员几经反复
可修排队系统考虑了服务设备会发生故障这一实际情况,即服务台可能发生故障且可修复的排队系统。研究可修排队系统要从排队指标和可靠性指标两方面进行。本文研究成批到达的M
完善体育篮球教材建设体系,加强学生对篮球知识的了解,可以调动学生参与篮球竞技运动锻炼的兴趣,塑造学生的团结合作意识和顽强的意志,磨练学生的耐力.本文将简单论述学校体
微分方程是以方程描述未知的函数与其导数之间关系的一种形式。微分方程在数学及其应用中的意义在于:许多实际中的物理与技术问题的研究,都可以归结为微分方程的求解问题。微分
湖南省岳阳市正中绞扣钢丝厂生产的《岳阳楼牌》切坯纲丝,是采用李祖南先生发明的、荣获专利权的“全自动砖瓦切坯钢丝绞扣机”(实用新型专利号:ZL95237237.1)生产的产品。本
本文在有界区域上研究广义Kawahara方程的初边值问题,运用压缩映射原理得到局部解,结合能量积分方法、不等式技巧和嵌入定理建立解的先验估计证明了在有界区域上整体正则解的存
系统发生学是分子进化生物学的一个重要研究领域,涉及生物信息学、数学、生物统计学以及计算机等学科.近年来,基于系统发生学的计算分子进化发展迅速,在进化遗传学、生态学以及
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.