论文部分内容阅读
当今社会是一个信息爆炸的时代,如何充分利用各种各样的信息为人类服务已显得越来越重要。作为新兴的知识发现技术——数据挖掘以及辅助决策工具——决策支持系统已越来越受到人们的关注,它们为人们从大量数据中获取感兴趣的、有用的信息提供了便捷之道。 在数据挖掘众多的研究分支中,分类和预测问题一直是一个十分引人注目的主要分支,许多学者从各个角度如统计、信息理论、神经网络等方面做了大量的研究,取得了一系列的重要成果。本文基于已有的研究成果,主要做了如下的工作: 1、探讨了分类和预测的处理模型,对现有分类和预测算法进行分类,比较了各自的优缺点及适用性,分析了现存算法的不足之处。 2、针对现存算法的不足,提出了构建概念层次的方法,对空缺值的处理方法也进行了探讨。 3、提出一种基于概念分层的分类挖掘算法,通过偏序、格构建概念层次,利用信息增益选择最佳属性集,并且探讨了算法的增量学习版本,最后针对该算法在超大型数据处理方面的不足,还给出了一种解决方法。 数据挖掘作为一种新的信息获取技术,为了将之更好的应用于生产生活实践,本文还探讨了它在决策支持系统中的应用。具体来说,主要做了如下的工作: 1、分析了传统决策支持系统的研究落入低谷的原因,指出了其不足之处,探讨了数据挖掘技术在决策支持系统中的地位和作用。 2、介绍了数据仓库的体系结构以及国内外应用状况,研究了数据挖掘技术和数据仓库技术结合的有效性。 3、提出了一种新的基于数据仓库和数据挖掘的决策支持系统,并指出了这种新型决策支持系统的体系结构和关键技术,分析了这种框架构成的特点,最后对在银行决策支持系统中的应用进行了初步探讨。