论文部分内容阅读
该文将研究范围定位在空间数据的位置不确定性,通过引入信息熵的有关理论,建立了矢量GIS中点元、线元及面元的一系列熵不确定性模型,克服现有模型的一些不足.现将主要的研究内容概括如下:(1)首先对现有的一些主要的位置不确定性模型进行了分析,提出了三个方面的不足:一是现有模型的建立大多需要点位误差符合正态分布这个假设条件,而由于GIS数据来源的复杂性,实际上这一条件难以满足.对于非正态分布甚至是未知分布的情况,如何合理地估计其不确定度是一个亟待解决的问题.二是现有的大多数模型本质上是在某一置信水平下的概率模型.由于置信水平的选取因人而异,导致一系列的误差指标簇.如何使所建不确定性模型不受置信水平选取的主观性影响也是一个值得探讨的问题.三是现有的一些模型过于复杂、不便于实际使用;而等带宽的"ε带"因为简单实用,故被人们广泛采用,但带宽的合理确定一直是一个难点.(2)借鉴确定一维随机变量熵不确定区间的基本思想,将一维随机变量的熵不确定区间指标扩展至二维随机点的熵误差椭圆、三维随机点的熵误差椭球和N维随机点的熵误差超椭球指标,并分别计算了随机误差落入这些熵误差指标内的置信概率,给出了计算熵系数和置信概率的统一公式.(3)对于点位误差服从非正态分布和未知分布的情形,在方差或协方差矩阵被给定的情况下,根据连续随机变量(矢量)在平均率受限下的最大熵定理,按照正态分布的最大熵确定了一个保守的点位熵不确定性指标,克服了对于非正态分布往往按正态分布处理的不合理性.另外,还对综合误差的熵不确定度进行了初步地研究.(4)在线元和面元的位置不确定性研究方面,该文将所提出的点位熵不确定性指标推广到线元和面元上,提出了熵意义下的"g-带"和"g-环"模型.讨论了熵意义下的"E-带"和"e-带"模型;依据线元上各点沿垂直于线元方向的边缘概率分布的信息熵建立了熵意义下的"ε<,H>-带"模型.在史文中博士所提的线段误差指标簇中扩充了一个熵误差指标;根据X<2>分布的熵建立了线元的熵区域.(5)考虑到现有的一些模型过于复杂,不便于实际使用,而等带宽的"ε带"虽然简单实用,但带宽难以确定的情况,在分析"H-带"局限性的基础上,依据整个线元沿垂直于线元方向的边缘概率分布的平均信息熵建立了线元的熵带模型,导出了计算带宽的统一公式.研究了面元的"ε<,H>-环"、最大误差熵环、平均误差熵环、熵误差环及其平均熵误差环等模型.该文所提的一些误差模型是对已有研究的一种有益的补充,对GIS的数据质量控制会起到一定的积极作用.空间数据不确定性理论研究是一个富有挑战性的研究课题,只有充分地借鉴相关学科的研究成果,才能建立起较为完整的不确定性理论框架.利用信息论来研究空间数据的位置不确定性的工作还仅仅的该研究的开始,利用模糊熵研究模糊不确定性的度量以及利用混合熵来研究模糊随机性是进一步努力的方向.