论文部分内容阅读
[摘要] 以ArcGIS技术为基础,融合人口信息存储、管理与空间分析,并依靠大型关系数据库管理技术、网络计算机技术等计算机领域和GIS领域的最新发展。建立河南省各市区人口信息一体化数据库系统,从而实现对空间数据和人口数据的有效管理、维护、显示、输出、统计分析、共享与发布等功能,为人口统计部门作出各种决策提供科学依据。
[关键词] ArcGIS 人口资源 数据库
0 引言
人口信息是国家的基础信息之一,而我国是一个人口众多的国家,目前人口统计局的工作重点和难点已经逐步聚焦在如何有效管理和利用日益增多的统计数据上。传统的人口管理信息系统管理的都是数字型数据,并采用数字和文字的方式实现数据的输入、维护、查询和统计,不仅形式呆板,更新缓慢,而且无法及时地查询一些重要的人口信息,更难于揭示人口的发展规律,已无法满足信息时代经济快速发展的需要[1]。为科学、高效地管理人口数据,提高人口管理信息化的技术水平,实现人口信息服务的有效增值,开发GIS人口资源数据库管理系统势在必行。
1数据库数据模型及数据组织
1.1数据模型
人口资源GIS空间数据主要由地理底图数据、点文件、线文件、面文件组成,其中地理底图数据包含一些最基本的信息,如道路、建筑物等;各城市位置的空间数据形成点文件;省界、市界等的空间数据形成线文件;省、市、流域等的空间数据形成面文件。空间数据结构如表1,数据库分层结构如表2。
表1 空间数据结构
河南省人口资源空间数据 库
点要素层 各城市位置 城市位置
线要素层 省界层 河南省边界
市界层 各市边界
面要素层 省层 河南省
市层 各市
河流层 黄河流域
地理底图 河南省地图 河南省政区图(JPG)
表2 数据库分层结构
层 层名 属性项 处理方式和功能
省界层 L_Province ID 作为线状地物处理
市界层 L_City ID 作为线状地物处理
河流层 L_River ID、Name、
Total_length
Flow 主要是黄河流域
,作为线状地物
进行处理,用于
显示和分析
省层 P_Province ID、Name、Area、
Population、Man、Female、
OldPopulation、Urban、
Rural、ResidentsPopulation
NaturalGrowthRate
作为多边形进
行处理
市层 P_City ID、Name、Area、
Population、Man、Female
OldPopulation、Urban、Rural、
ResidentsPopulation 省内各个市的范
围,作为多边性
进行处理
1.2数据组织
概念结构(本设计中主要指E-R模型)是各种数据模型的共同基础,它比数据模型更独立于机器,也更抽象,但为了能够用某一DBMS(本设计中指建立数据库使用的SQL Sever)实现用户需求,还必须将概念结构进一步转化为相应的数据模型。从理论上来说,设计逻辑结构应该选择最适合于描述和表达相应概念结构的数据模型,然后对支持这种数据模型的各种DBMS进行比较,综合考虑性能、价格等各种因素,从中选择最合适的DBMS。本数据库选择SQL Sever作为使用开发数据库的数据库管理系统[1][2]。设计逻辑结构分以下三步进行:
a.将概念结构(E-R模型)转化为一般的关系模型;
b.将转化来的关系模型向SQL Sever支持下的数据模型转换;
c.对数据模型进行优化。
2.空间数据库中属性表与属性关系的设计
在关系数据库中,数据库的文件是单元式属性表,属性表是属性值的二维表格表示形式,表与表之间存在着某种关系,即以相互关联的两个表中均存在的某一公共项来维持,这一公共项叫做关键字。使用关系表对一个数据库的设计来说是很关键的,因为它影响到整个数据库运作的行为和效果。ArcGIS数据库中的空间数据和属性数据之间的关系就是靠关键项来维持的[3-5]。必须保证:
a唯一性:在每个表中,每个记录的关键项均必须是唯一的;
b不变性:不含有其他方面的信息;
c纯粹性:不含有其他方面的信息;
d不重复性:不会被重复使用,即某一个值被删除后,不会再被使用;
e可获得性:需要时便可以拿来到此信息。
3.关系模型的优化
在以上关系模型的设计中,没有考虑到用户需求,另外,从查询效率等角度考虑,规范化的处理造成关系的破碎化(单一化),增加了关系连接的计算量。因此,需要在规范化处理的基础上结合用户需求和查询效率进一步优化[6]。
关系模型设计的主要目标是降低数据冗余度以减少空间浪费、保证数据完整性和快速地从关系中存取数据。但是这两个要求从本质上来说是有冲突的。实际的数据库设计中需要在这两个要求之间找到合理的平衡,其本质是空间(以及完整性)和时间效率之间的折中[6][7]。
为了降低数据冗余度的同时获取较高的查询效率,必须认真分析用户需求,以便从最常用的查询要求中找到使用最频繁的连接运算及相关的关系模式,并以此为依据,对有关关系模式进行必要的合并[8]。
4.数据库的建立
选择北京54坐标系统,对投影后的地图进行配准配准后的地图就是一幅有地理坐标的地图[6]。矢量化图见图1,市层属性库见图2,数据库见库流程如图3。
图1 市层 图2市层属性表
5.实现结果
通过人口散点图可以很直观的看出河南省的人口分布,可以粗略的判断各市的人口数量的多少。这只是对各市人口密度的一个比较直观但略显粗略的观察,如果想详细了解各市的人口密度可以根据各市面积和人口数进行查询计算。当然也可以查询人口密度在一定范围内的市都有哪些或将人口密度大于或小于某一指标的城市筛选出来等等。河南省各市区人口密度散点图如图4。
6.結论
河南省人口资源数据库分布式数据库管理系统克服了传统的中心数据库管理数据录入和访问点分散、数据处理的地域分布性弱等缺点。对于政府行政管理部门基于计算机网络的分布式数据库应用系统可以将许多分散在各地的部门或单位孤立的数据联接起来,形成一个有机整体。一方面,对最终用户来说,这个系统是透明的,用户不需要关心数据的来源及分布,另一方面,作为政府各部门可以继续在本地维护自己的数据,同时在需要的时候可以很方便地、透明地访问本系统中分布在异地的数据。
图3 数据库建库流程图
图4 河南省各市区人口密度散点图
参考文献:
[1]高寒松,李满春.常州市人口地理信息系统的设计与实现[J].现代测绘,2006,29(4):3-5.
[2]金君,印洁,李成名等.人口地理信息系统的设计与建设[J].工程勘察,2002,5(3):51-54.
[3]何宗宜,贾凉.人口地理信息系统的研制[J].地理空间信息,2005,4(3):3-5.
[4]李满春,任建武,陈刚,等.GIS设计与实现[M〕.北京:科学出版社,2003
[5]郭崇慧,田凤占.数据挖掘教程[M」.北京:清华大学出版社,2005
[6]游允中.收集人口数据的方法[M].北京:中国统计出版社, 1997.
[7]王太元.户政与人口管理理论研究综述[M].北京:群众出版社, 1997.
[8]苏莹,王英杰,余卓渊.人口信息空间可视化系统设计研究[J].测绘科学,2005,30(3):38-40.
作者简介:
刘艳萍,女,河南焦作人,主要做地理信息系统、测绘等研究工作。
[关键词] ArcGIS 人口资源 数据库
0 引言
人口信息是国家的基础信息之一,而我国是一个人口众多的国家,目前人口统计局的工作重点和难点已经逐步聚焦在如何有效管理和利用日益增多的统计数据上。传统的人口管理信息系统管理的都是数字型数据,并采用数字和文字的方式实现数据的输入、维护、查询和统计,不仅形式呆板,更新缓慢,而且无法及时地查询一些重要的人口信息,更难于揭示人口的发展规律,已无法满足信息时代经济快速发展的需要[1]。为科学、高效地管理人口数据,提高人口管理信息化的技术水平,实现人口信息服务的有效增值,开发GIS人口资源数据库管理系统势在必行。
1数据库数据模型及数据组织
1.1数据模型
人口资源GIS空间数据主要由地理底图数据、点文件、线文件、面文件组成,其中地理底图数据包含一些最基本的信息,如道路、建筑物等;各城市位置的空间数据形成点文件;省界、市界等的空间数据形成线文件;省、市、流域等的空间数据形成面文件。空间数据结构如表1,数据库分层结构如表2。
表1 空间数据结构
河南省人口资源空间数据 库
点要素层 各城市位置 城市位置
线要素层 省界层 河南省边界
市界层 各市边界
面要素层 省层 河南省
市层 各市
河流层 黄河流域
地理底图 河南省地图 河南省政区图(JPG)
表2 数据库分层结构
层 层名 属性项 处理方式和功能
省界层 L_Province ID 作为线状地物处理
市界层 L_City ID 作为线状地物处理
河流层 L_River ID、Name、
Total_length
Flow 主要是黄河流域
,作为线状地物
进行处理,用于
显示和分析
省层 P_Province ID、Name、Area、
Population、Man、Female、
OldPopulation、Urban、
Rural、ResidentsPopulation
NaturalGrowthRate
作为多边形进
行处理
市层 P_City ID、Name、Area、
Population、Man、Female
OldPopulation、Urban、Rural、
ResidentsPopulation 省内各个市的范
围,作为多边性
进行处理
1.2数据组织
概念结构(本设计中主要指E-R模型)是各种数据模型的共同基础,它比数据模型更独立于机器,也更抽象,但为了能够用某一DBMS(本设计中指建立数据库使用的SQL Sever)实现用户需求,还必须将概念结构进一步转化为相应的数据模型。从理论上来说,设计逻辑结构应该选择最适合于描述和表达相应概念结构的数据模型,然后对支持这种数据模型的各种DBMS进行比较,综合考虑性能、价格等各种因素,从中选择最合适的DBMS。本数据库选择SQL Sever作为使用开发数据库的数据库管理系统[1][2]。设计逻辑结构分以下三步进行:
a.将概念结构(E-R模型)转化为一般的关系模型;
b.将转化来的关系模型向SQL Sever支持下的数据模型转换;
c.对数据模型进行优化。
2.空间数据库中属性表与属性关系的设计
在关系数据库中,数据库的文件是单元式属性表,属性表是属性值的二维表格表示形式,表与表之间存在着某种关系,即以相互关联的两个表中均存在的某一公共项来维持,这一公共项叫做关键字。使用关系表对一个数据库的设计来说是很关键的,因为它影响到整个数据库运作的行为和效果。ArcGIS数据库中的空间数据和属性数据之间的关系就是靠关键项来维持的[3-5]。必须保证:
a唯一性:在每个表中,每个记录的关键项均必须是唯一的;
b不变性:不含有其他方面的信息;
c纯粹性:不含有其他方面的信息;
d不重复性:不会被重复使用,即某一个值被删除后,不会再被使用;
e可获得性:需要时便可以拿来到此信息。
3.关系模型的优化
在以上关系模型的设计中,没有考虑到用户需求,另外,从查询效率等角度考虑,规范化的处理造成关系的破碎化(单一化),增加了关系连接的计算量。因此,需要在规范化处理的基础上结合用户需求和查询效率进一步优化[6]。
关系模型设计的主要目标是降低数据冗余度以减少空间浪费、保证数据完整性和快速地从关系中存取数据。但是这两个要求从本质上来说是有冲突的。实际的数据库设计中需要在这两个要求之间找到合理的平衡,其本质是空间(以及完整性)和时间效率之间的折中[6][7]。
为了降低数据冗余度的同时获取较高的查询效率,必须认真分析用户需求,以便从最常用的查询要求中找到使用最频繁的连接运算及相关的关系模式,并以此为依据,对有关关系模式进行必要的合并[8]。
4.数据库的建立
选择北京54坐标系统,对投影后的地图进行配准配准后的地图就是一幅有地理坐标的地图[6]。矢量化图见图1,市层属性库见图2,数据库见库流程如图3。
图1 市层 图2市层属性表
5.实现结果
通过人口散点图可以很直观的看出河南省的人口分布,可以粗略的判断各市的人口数量的多少。这只是对各市人口密度的一个比较直观但略显粗略的观察,如果想详细了解各市的人口密度可以根据各市面积和人口数进行查询计算。当然也可以查询人口密度在一定范围内的市都有哪些或将人口密度大于或小于某一指标的城市筛选出来等等。河南省各市区人口密度散点图如图4。
6.結论
河南省人口资源数据库分布式数据库管理系统克服了传统的中心数据库管理数据录入和访问点分散、数据处理的地域分布性弱等缺点。对于政府行政管理部门基于计算机网络的分布式数据库应用系统可以将许多分散在各地的部门或单位孤立的数据联接起来,形成一个有机整体。一方面,对最终用户来说,这个系统是透明的,用户不需要关心数据的来源及分布,另一方面,作为政府各部门可以继续在本地维护自己的数据,同时在需要的时候可以很方便地、透明地访问本系统中分布在异地的数据。
图3 数据库建库流程图
图4 河南省各市区人口密度散点图
参考文献:
[1]高寒松,李满春.常州市人口地理信息系统的设计与实现[J].现代测绘,2006,29(4):3-5.
[2]金君,印洁,李成名等.人口地理信息系统的设计与建设[J].工程勘察,2002,5(3):51-54.
[3]何宗宜,贾凉.人口地理信息系统的研制[J].地理空间信息,2005,4(3):3-5.
[4]李满春,任建武,陈刚,等.GIS设计与实现[M〕.北京:科学出版社,2003
[5]郭崇慧,田凤占.数据挖掘教程[M」.北京:清华大学出版社,2005
[6]游允中.收集人口数据的方法[M].北京:中国统计出版社, 1997.
[7]王太元.户政与人口管理理论研究综述[M].北京:群众出版社, 1997.
[8]苏莹,王英杰,余卓渊.人口信息空间可视化系统设计研究[J].测绘科学,2005,30(3):38-40.
作者简介:
刘艳萍,女,河南焦作人,主要做地理信息系统、测绘等研究工作。