论文部分内容阅读
人口问题是关系着我国社会经济可持续发展的重要问题。随着人们对人口问题的关注和深入研究,人口数据逐步形成一个庞大的贯穿时间域、空间域和属性域的数据立方体,人们对如何有效处理、充分利用、科学挖掘人口数据提出了更高的要求。
目前,地理信息科学空间可视化技术凭借其对多维人口数据的时空管理和直观表达上的独特优势在人口领域已得到广泛应用并取得了一定进展,然而在综合分析表达人口各因子、人口与其他社会经济指标的空间分布关系方面还比较薄弱。本文的研究目的就是将空间可视化技术与数据挖掘技术相结合,从人口普查数据及相关社会经济统计数据中发现、提取并表达潜在空间分布规则和联系,为人口研究及相关决策提供依据。
本论文首先在分析国内外人口可视化及数据挖掘应用的基础上,设计并建立了一套基于空间可视化的人口数据挖掘框架以及人口数据库、人口知识库体系。
然后,本论文对基于空间可视化的人口数据挖掘框架的实现进行逐步论述,主要包括:
(1)数据挖掘任务及预处理。
本文在对人口数据及相关社会经济统计数据的可视化认知基础上,明确了人口数据挖掘任务,并实现了人口数据挖掘预处理。主要包括利用常规统计方法的数据清理、基于空间分析的数据转换以及在空间可视化辅助下的数据属性规约。
(2)知识的生成和表达。
本文通过实现空间可视化辅助下的Apriori关联规则算法,得出人口数据与相关社会经济统计数据的空间分布关联规则,并生成基于知识的地图将获取的知识规则进行可视化表达及验证。同时,将有效的人口规则存入知识库,实现知识的有效归纳与系统管理。
最后,本文以人口性别比为例,进行了基于空间可视化的人口数据挖掘应用试验,论证了该框架体系的可行性和有效性。