论文部分内容阅读
近年来,随着信息技术和数据仓库技术的发展,数据挖掘作为一个全新的信息处理技术迅速发展并逐步走向成熟。数据挖掘就是一种从大量的数据中提取新颖的,隐含的,有效的信息的高级处理过程。聚类分析技术和关联规则挖掘技术是数据挖掘领域中两种有效的信息处理方法。聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或组处理的重要手段和方法。聚类分析也可以看作一种数据预处理技术,用于发现隐藏在海量数据中的有价值的未知类,为信息的高效分析处理提供技术支持聚类分析已被广泛应用于统计学、机器学习、空间数据库、生物学以及市场营销等领域;关联规则挖掘技术用于从大规模数据库中提取有价值的规则,从而对人类的实践活动提供指导。粒度计算理论是对人类分析和解决问题的过程的一种模拟,它是一种新的信息处理方法,它利用了人类能从不同的粒度去思考、分析和解决问题的重要特性,用于处理一些复杂的、非结构化的、不完整的、不确定的信息。分层递阶这一概念正是粒度计算这一思维方法的重要体现,它很早就已经广泛应用到电子信息,自动控制以及管理决策等学科领域当中已经被应用于许多领域中。本文从数据挖掘的理论出发,着重阐述了聚类分析技术和规则挖掘技术的理论和特点,利用粒度计算的层次化分析解决问题的思想,提出了基于粒度原理的层次规则挖掘算法,它采用“分裂—凝聚”的层次化方法是对数据进行分析归类,有效的解决了传统聚类分析算法在出处理海量数据时存在时空性能方面的不足的问题,并从理论和实验两个角度证明了新算法的可行性和时空效率,具有一定的实用价值。最后,在对传统的关联挖掘方法进行分析研究,了解其特性与不足的基础上,利用信息粒在数据层次化和频繁集求解方面的优势,将粒度原理与规则挖掘方法相结合,得到了基于粒度原理的层次规则挖掘方法,并用实例分析了算法的有效性。