论文部分内容阅读
山西是一个矿业资源丰富的大省,在全国的煤矿储量中占有非常大的比例,山西的城市绝大部分也是矿业城市。近几年国家对煤矿的重视程度也越来越大,山西的小煤矿企业被整合重组,这是对煤矿资源性城市面临的资源枯竭、经济发展受到制约的措施。本文根据矿业城市以牺牲资源、环境为代价换来经济的高速发展的特点,将国家近年来一直提倡的绿色经济、低碳经济的指标加进去,提出适合矿业城市自身的22个综合竞争力指标体系,主要目的是为了找出矿业城市自身发展的优点和缺点,因地制宜的发展循环经济。本文根据实际问题的特点采用数据挖掘算法中k-means算法的改进算法即模糊均值聚类算法进行研究,模糊均值聚类算法是通过建立模糊相似关系而将客观事物予以分类的方法,这种划分带有相对的特点,因此适用于复杂多变的聚类分析。根据传统的聚类分析的特点,传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地划分到某个类中,这种划分的类别界限是严格分明的。但是实际上大多数实际对象并没有严格的属性,它们在性态和类属方面存在着模糊性、中介性,适合进行软划分。而模糊集理论为这种软划分提供了有力的理论分析基础。因此,本文通过引入模糊集理论的方法来处理矿业城市竞争力聚类问题,从而实现了定性和定量相结合,得到了城市样本属于各个类别的不确定性程度,表达了城市样本类属的中介性,建立起了城市样本对于类别的不确定性的描述,从而能更客观地反映现实的分类情况。根据分析,对矿业城市发展需要的数据集进行预处理,并给出了预处理的流程:数据选择,数据清理,数据转换,数据规约。通过对数据集的预处理得到需要的数据表。本文利用Java语言编写出了模糊聚类算法的程序设计,并将该程序放到Weka软件中不仅实现了算法本身的优点而且也利用了Weka软件的优点。用改进后的Weka挖掘工具对山西省的矿业城市进行挖掘,根据模糊聚类算法对山西省矿业城市竞争力进行聚类,这样可以避免人为的主观因素,能够客观的对城市做出聚类。本文通过实例应用,验证了模糊聚类在分析矿业城市竞争力模型中的合理性和有效性。模型的评价结果不仅能有效的对城市进行分类,还能展示城市指标之间的联系。依据这种挖掘结果,矿业城市可以因地制宜的制定有利于提高矿业城市竞争力的发展策略。