论文部分内容阅读
本论文研究了决策树算法中最为重要的一种ID3算法,并引入逻辑描述的概念,定义了基于逻辑描述的ID3决策树算法,在一定程度上改善了决策树合理生长的问题;然后,在决策树形成的大量分类规则的基础上,提出用逻辑元规则和逻辑兴趣度结合的方法对决策树进行逻辑关联分析,提取用户感兴趣的规则,进一步提高挖掘效率。
首先,本文在传统ID3决策树算法的基础上,提出逻辑描述的概念,构建了基于逻辑描述的ID3决策树。 其次,决策树构建后,会形成大量的分类规则,针对ID3决策树构建后存在的局限性,以关联规则兴趣度的研究为依据,提出采用逻辑元规则和逻辑兴趣度结合的方法对决策树进行逻辑关联分析。
最后,本文采用某保险公司客户数据,使用Prolog语言实现整个过程,构建了基于逻辑描述的ID3决策树,并对决策树进行了逻辑关联分析,这是用逻辑推理方法解决数据挖掘问题的一种尝试,实验结果表明该方法提高了挖掘性能。