论文部分内容阅读
二十一世纪是信息技术高速发展的时代,信息资源是重要的战略资源。水资源管理是一个信息密集型行业,信息资源的重要性显得更为关键。随着遥感、遥测、网络、数据库等技术的广泛应用,有力促进了水资源数据的采集和处理技术的发展,使之在时间和空间尺度及要素类型上有了不同程度的扩展。大量宝贵的水资源数据中隐含着许多重要的信息,如何及时、有效地分析处理这些数据,从激增的数据背后挖掘出有价值的信息,为决策提供重要的支持作用已经越来越引起人们的关注。数据挖掘技术是解决“数据丰富、信息缺乏”问题的一种有效方法。数据挖掘技术能够从大量数据中发现并抽取隐含的、新颖的、有意义的并能被人理解的信息和模式,实现从简单数据到信息再到知识的蜕变。本文在充分理解数据挖掘基本理论的基础上,将数据挖掘技术应用到水资源领域。从水资源数据的特点和分析需求出发,以水资源利用主题数据仓库的构建为例,说明了建立水资源数据仓库的方法;以数据挖掘一般过程为基础构建了水资源数据挖掘的框架结构,对水资源数据挖掘过程中的关键问题做出论述,总结了数据挖掘方法在水资源领域的应用方向。本文选择水资源严重短缺的北京市作为研究区域,通过SAS数据挖掘工具研究数据挖掘技术在水资源领域的应用,为解决水资源问题提供信息支撑。首先,利用相关分析和回归分析方法分析了各用水部门的用水规律,建立了各部门用水量与其主要影响因素之间的函数关系。通过本实例证明数据挖掘技术可以快速、准确地发现数据之间的相关关系,建立反映客观规律的数学模型,为用水管理提供决策支持。其次,利用SAS数据描述与图形展现工具分析了不同土地利用类型、不同时期的ET(蒸发蒸腾量)变化趋势,以及降雨、气温、风速、相对湿度等水文气象因素对ET的影响,为区域ET管理提供信息支持。在实际应用中发现,数据挖掘技术在处理海量数据方面有很大优势,不仅能快速实现海量数据的多样化统计分析,而且以丰富的图形展现给用户,有利于分析结果的解释和理解。最后,运用逐步自回归模型、指数平滑模型和季节性模型分别建立了地下水观测井的水位标高预测模型,并对模拟和预测结果进行了比较和优选。总体来说,季节性时序模型的模拟和预测精度较高。时间序列模型较全面地反映了地下水位动态变化规律,且计算简单,所需资料较少并易于获得,是一种较好的模拟预测模型,能够应用于分析地下水位动态变化和预测地下水位,为区域地下水的合理开发利用提供可靠依据。