论文部分内容阅读
数据挖掘是在20世纪80年代,投资人工智能(artificial intelligence,AI)研究项目失败后,AI转入实际应用时提出的。它是一个新兴的、面向商业应用的AI研究。
随着数据膨胀、技术进步以及强大的商业需求,数据挖掘开始兴起。本文系统讲解数据挖掘的步骤和任务,重点研究数据挖掘理论当中的聚类分析和关联规则。本文介绍了k-means算法和关联规则的相关理论,同时为了充分理解聚类分析和关联规则,本文引入了具体的商业案例;从结构上看,首先介绍数据挖掘概况和挖掘流程;其次,重点讲解聚类分析的算法并给出相关的理论证明;再次,介绍关联规则的相关算法和挖掘步骤;最后,结合具体的商业案例,利用SAS统计软件进行数据挖掘。
具体的数据挖掘过程是一个反复尝试最后找出规则以便解释现象的过程,它不但需要熟练掌握数据挖掘算法并且需要了解具体的行业背景。本文把数据挖掘理论运用到了具体的商业案例当中,为资源的配置和决策提供了支持。