基于概率及复合指标的矢量数据对比技术研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:wangligang987123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中,一个地区或城市通常由不同的部门在不同的时间负责采集地理数据,并各自建立相应的地图数据库,在地理信息系统中亟待解决的问题是,如何将来源不同或者差异程度不同数据进行融合或者集成,以生成新的数据集,用于后续各研究。这里通常采用的技术是数字地图合并。数字地图合并在地理信息数据融合集成和增量分析领域中应用非常广泛,也是地理信息系统(GIS)工程建设的一个难点。数字地图合并技术通常包括两个过程——实体匹配以及地图合并,也就是先比较实体的几何、属性以及图形等信息,然后进行不同地区不同类型数据的融合和集成。通常该技术以实体匹配为基础,获得两个源数据集的属性和图形相关关系,再进行两者之间的融合,其中一幅图被称作“源图”或者“参考图”,而另一幅图则被称作“目的图”或者“调整图”。这两步缺一不可,都极为关键,其中实体匹配可看作是数字地图合并的第一步或基础,而后续的合并变换则是数字地图合并结果的最终来源。同名实体是指两幅图或两个数据库中反映现实世界同一地物或地物集的空间实体。同名实体的识别或匹配是通过分析空间实体的差异(由于制图误差、不同的应用目的或不同人的解释差异以及制图综合等因素的影响而产生)和相同或相似点以辨别出不同来源数据集中表示同一实体的技术。传统的地图实体匹配方法主要考虑的是实体的空间信息,也就是比较实体的空间位置、形状和方向等方面的相似性和差异,但是在GIS的地理数据库中,必须综合比较分析矢量数据的属性、空间和图形信息,才能得到最好的对比结果,以进行下一步的空间增量更新工作。本文在国内外学者的研究基础上,结合国家“863”项目——“支持增量更新的分布式异构空间数据无缝集成技术研究”,分析了现存地图实体匹配算法的优缺点,进而立足于GIS发展的前沿,探讨当前数据对比的新理论、方法和技术,提出了基于概率及复合指标的矢量数据对比技术,综合考虑矢量数据的属性、空间和图形信息,融合了多种信启、指标,并能有效解决非一对一的匹配情况。实验结果表明该方法具有良好的精度和召回率,对比结果可有效应用于矢量地图数据的增量更新。针对数据对比技术特点,本文主要从以下几个方面开展研究工作:第一章详细介绍了国内外地图实体匹配算法研究现状,并分析了现存算法的优点,总结当前存在且急需解决的缺点和不足,提出了探讨和研究新的匹配算法的必要性和可行性。第二章系统探讨了数字地图合并技术,包括数字地图合并的基本概念,数字地图合并的研究内容、范畴和技术流程,以及数字地图合并技术与其他技术的关系。第三章对数据对比技术中用到的矢量数据进行分析,包括其属性信息和空间信息。根据实体属性信息的特点,对属性信息的差异进行详细分类,以此设计实体属性结构规则和属性信息对比方法。此外,对实体空间信息的指标选取和计算方法进行了详细的介绍,并探讨了同一实体按指标不同权重选取阈值的办法。第四章总结了实体匹配中使用的各种非概率匹配算法,对传统的基于概率理论的实体匹配算法以及基于概率及复合指标的矢量数据对比算法进行了详细分析。介绍了传统的基于概率理论的匹配算法中候选集的确定、权重的选取以及单个实体匹配概率和数据集匹配概率的计算,新算法中按照实体空间信息特征分类,细化和精确了指标的计算,融入了属性对比,并进一步优化了阈值的选取。第五章中介绍了数据对比功能在MAPGIS7.x中从设计到实现的过程。首先介绍了数据对比的设计思想和总体框架,然后详细介绍为了实现数据对比模块需要在地理数据库中增加的主要接口,最后给出了实现之后的功能截图以及分析结果报告。
其他文献
全过程计算机辅助动画自动生成技术(Full Life Cycle Automatic Generation of Computer Animation)是人工智能理论与现代多媒体技术相结合的全新动画制作技术,它是一个崭新的
软件测试是对软件需求分析、概要设计、详细设计格说明书与编码进行审查,对软件系统进行检测的系统化过程。软件过程模型是对软件测试过程细节的抽象。在长期的研究与实践中,
在全球互联网资源急剧膨胀的情况下,搜索引擎技术为人们查找所需资料提供了一个良好的接口。然而,面对通用搜索引擎的信息量大、查询不准确、深度不够等问题,垂直搜索引擎应
互联网络飞速发展的同时网络安全事件日益增多,对于高性能网络入侵防御系统的需求日趋强烈。基于硬件加速的入侵防御系统不能满足不断变化的攻击手段。网络流量的不断增加对
随着Intenet/3G网络技术、流媒体技术、嵌入式技术的发展,以及人类对安全防护、机械自动化等的重视,监控系统的发展前景越来越广阔。本文设计并实现了一种便于使用、性能稳定
网络管理信息模型是网络管理的核心内容之一,网络管理活动是以管理信息模型为中心来展开的。传统的网络管理信息模型主要是针对面向连接的网络定义和设计的,近年来针对无连接
随着GIS的迅速发展和广泛应用,各行各业的用户对GIS的需求也越来越具体,同时要求定制的级别也越来越高。这不仅考验着GIS开发人员的开发水平和设计能力,同时也更是对现有的GIS开
P2P系统是近年来出现的一种很流行的应用,P2P的对等网络结构使节点既可充当服务请求者,又可以是服务提供者,相对传统的C/S架构有很多优势。P2P系统可分为结构化P2P和非结构化
混沌系统是具有复杂的、不可预见行为的确定性非线性系统,初值敏感性是其主要特性之一,这一特性使得混沌同步的方法在保密通信领域得到了广泛的应用。近年来,混沌系统同步的
地下水是我们生活中不可缺少的自然资源。随着现代工农业的迅速发展,人类对地下水资源的合理开发和有效利用,逐渐成为了学术界所关注的焦点。我们主要利用数值模拟的方法来进