论文部分内容阅读
随着数据库技术的发展、计算机网络技术的迅猛普及和计算机硬件技术的不断改进,人们采集数据的能力得到了极大的提高,积累了“海量”的数据。这些数据中蕴涵了大量有价值的知识、模式、规律等,人们为了获取这些潜在的信息以指导生产、生活,数据挖掘技术应运而生。数据挖掘又称为数据库中的知识发现,是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程。近十几年来,数据挖掘技术已得到了广泛的应用及研究,并且已经在商业、金融、医疗等领域得到了成功地应用。近年来,国家多次强调要加强职业教育的发展,尤其是中等职业教育的发展,然而,中等职业教育正面临着严峻的挑战:虽然国家采取了大量的扶持中职学校的政策,但生源问题还是困挠中等职业学校发展的一个迫在眉睫的问题,如何增强自身的竞争力,争取更多的高质量的生源,促进学校的发展,是摆在各个中等职业学校面前一个非常棘手的问题。为了有效地解决好这个问题,发掘出潜在的、有用的信息,依靠传统的数学分析及数理统计技术已经远远不能满足中等职业学校发展的需要。因此,必须借助数据挖掘技术,为各级教育主管部门、各个中等职业学校提供有力的决策支持。基于数据挖掘的研究现状和聚类算法的研究现状,本文主要进行了以下几个方面的研究工作:1、数据挖掘基本知识的深入研究及探讨。在介绍数据挖掘基本概念的基础上,对数据挖掘的对象、可发现的模式进行了详细的分类、归纳和总结,对数据挖掘常用技术做了介绍和分析。2、聚类算法的分析与研究。通过第3章和第4章,详细介绍了各种聚类算法,并对与论文有关的经典算法及基本思想进行了详细的归纳、分析和研究,对各种算法之间的差别进行了客观地比较,在此基础上,对k-means算法提出了改进。3、针对目前中职学校发展的需要,提出了一个基于数据挖掘技术的招生信息处理系统。第5章重点介绍了中职招生信息系统功能模块及各功能模块的主要任务,介绍了.net技术、B/S模式和C/S模式在中职招生信息系统中的应用,第6章介绍了招生决策数据仓库的建立过程及基本的OLAP操作。4、详细介绍了聚类算法在中职招生信息系统中的应用。第7章以实例的方式深入探讨了数据挖掘技术的实现过程,利用k-means及其改进算法,对招生数据进行挖掘,得出了理想的、有实际价值的规则及结论。