论文部分内容阅读
分层抽样在抽样调查中被广泛应用,为提高抽样的随机性、获得更高精度的数据提供了很大帮助,因此针对人口抽样调查研究设计适用的分层方法就显得尤为重要。近些年来,尽管GIS与计算机技术的快速发展给人口抽样调查地理框架体系的设计、管理提供了新技术手段,但是调查中仍采用专家经验进行手动分层,然而这种方式易受到个人主观因素的影响,很难得到客观而统一的结论。因此,我们迫切需要一个科学的分层模型以实现对各级样本单位分层规格化、系统化、自动化,最大可能的保证抽样的随机性。
本文的研究目的就是基于空间可视化的知识发现功能,在空间分析、统计学和数据挖掘方法支持下,定性定量分析我国人口空间分布特征与人口变动特征并以其作为分层标准,构建适合人口抽样调查的分层模型。本文的研究内容主要分为三大部分:基于空间可视化方法的人口空间分布特征与人口变动特征研究、人口抽样调查分层模型研究、模型校验研究。
首先,在“人口统计信息空间可视化系统”基础上,对人口统计数据、相关经济统计数据等数据进行空间可视化,并通过可视化认知得出人口空间分布特征、人口变动特征及其影响因素等初级知识。同时,结合相关领域的背景知识锁定分层拟采用的指标。
其次,本文在分析了国内外空间可视化、人口抽样调查方法、人口空间化模型进展的基础上,设计了一套适用于人口抽样调查的分层模型框架。在该框架的支持下,综合运用了遥感数据、交通数据、人口数据、社会经济统计数据等多源数据,定量分析了我国各地区分层拟采用指标同人口空间分布特征、人口变动特征相关关系,构建了对应样本地区的分层模型。在此基础上,针对省级单位和县级单位进行了二次分层试验,并针对分层结果进行了定性分析。
最后,基于分层模型,借鉴现行人口抽样方法,自主设计样本抽取办法。并根据现有数据设计出人口抽样调查分层模拟算法,通过模拟人口抽样调查以实现对分层模型与样本抽取方法的校检。采用C++语言在VS2005集成开发环境下制作了测试程序,对广东省、上海市、内蒙古自治区三个地区进行了上万次的模拟,统计分析发现获得的数据精度较高,验证了分层模型和样本抽取办法是科学的、有效的、可用的。
本论文是在“863”项目“人口普查与调查信息空间统计管理与分析系统”的支持下,针对人口抽样调查分层模型进行的研究。本文的研究属于基础性工作,文中对大量不同类型数据进行了分析,并辅以图表来说明,力图以翔实的数据和论证得到让人信服的理论。