论文部分内容阅读
据统计,在人类社会的生产和生活中,会接触到各种各样的信息,这些信息中有80%以上与地理分布和空间位置有关,但是这些信息大部分都只是对地理位置的描述信息,无法被计算机所应用,而地理编码是将用来描述地理位置的地址数据与空间坐标信息关联起来,从而将地址描述数据转换成可以用在计算机系统中的地理坐标,以方便用户对属性数据和地理实体进行定位和空间信息检索。
地理编码在城市空间定位和分析领域中的应用范围非常广泛,是沟通空间信息与非空间信息之间联系的重要桥梁。通过地理编码,可以将城市规划建设、警务系统、工商税务管理等社会各职能部门所涉及到的用来描述地址的信息与空间地理坐标相联系,并在地图上定位出来,以便更为直观地对空间信息与非空间信息进行整合分析,使政府及相关部门的决策及管理更具依据,从而完成对社会的管理及方案的指定。对于企事业单位等社会组织而言,可以满足其基于位置的服务要求;对公众而言,可以利用地理编码技术提供的地址查找工具帮助公众实现对指定地址的查询需求,以及了解指定地区的基本情况,这样可以减少外出的盲目性和对不熟悉的地区的地址进行查找时的困扰,从而节约时间和金钱。
但是由于中文地址、地名的特殊国情,中文地理编码问题却没有一个统一的规范和固定模式来解决。因此研究并实现一个适应国内地址现状并能满足各级职能部门和普通大众对中文地址的建库、地址管理和维护、地名定位和查找需求的地理编码系统是非常有意义的。
本论文针对实现中文地理编码的关键技术,主要进行了以下几方面的研究工作:
论文第一章详细介绍了国内外在地理编码方面的进行的研究以及应用,并分析了国内外地理编码存在的问题,提出了研究中文地理编码的必要性。
论文第二章对地名数据库的创建及地址匹配与定位过程中需要用到的中文分词技术做了详细研究。介绍了中文分词的分类及常见的三种方法:最大匹配法、最小匹配法和逐词遍历法,以及三种典型的分词词典机制:基于整词二分法、TRIE索引树法、逐字二分法,并从时间和空间角度对三种典型的中文自动分词词典机制进行了比较分析。
论文第三章对分级地址模型及其构建方法进行了研究。首先介绍了地名数据库的内容构成,及数据组织原则,然后从概念模型、逻辑模型和物理模型三方面对分级地址模型进行了研究,最后给出了运用中文分词技术来创建地名数据库的详细步骤。
论文第四章对地址匹配策略及根据地址信息在地名数据库中查询地理坐标的方法进行了研究。介绍了地址匹配与定位的基本原理,讨论了地址匹配的策略及在地名数据库中查询的方法,并给出了实现地址匹配的详细步骤,介绍了地址定位的三种方式:定位到街道、定位到区域以及混合定位。
论文的第五章介绍了中文地理编码在MAPGIS7.x中从设计到实现的过程。首先介绍了地理编码的设计思想和总体框架,然后详细介绍为了实现地理编码模块需要在地理数据库中增加的主要接口及地名数据库的主要接口,最后给出了实现之后的部分功能截图。
论文第六章对本论文的研究内容进行了总结,并对未来研究方向做了展望。