基于分级地名库的中文地理编码的研究与实现

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:zel0088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据统计,在人类社会的生产和生活中,会接触到各种各样的信息,这些信息中有80%以上与地理分布和空间位置有关,但是这些信息大部分都只是对地理位置的描述信息,无法被计算机所应用,而地理编码是将用来描述地理位置的地址数据与空间坐标信息关联起来,从而将地址描述数据转换成可以用在计算机系统中的地理坐标,以方便用户对属性数据和地理实体进行定位和空间信息检索。   地理编码在城市空间定位和分析领域中的应用范围非常广泛,是沟通空间信息与非空间信息之间联系的重要桥梁。通过地理编码,可以将城市规划建设、警务系统、工商税务管理等社会各职能部门所涉及到的用来描述地址的信息与空间地理坐标相联系,并在地图上定位出来,以便更为直观地对空间信息与非空间信息进行整合分析,使政府及相关部门的决策及管理更具依据,从而完成对社会的管理及方案的指定。对于企事业单位等社会组织而言,可以满足其基于位置的服务要求;对公众而言,可以利用地理编码技术提供的地址查找工具帮助公众实现对指定地址的查询需求,以及了解指定地区的基本情况,这样可以减少外出的盲目性和对不熟悉的地区的地址进行查找时的困扰,从而节约时间和金钱。   但是由于中文地址、地名的特殊国情,中文地理编码问题却没有一个统一的规范和固定模式来解决。因此研究并实现一个适应国内地址现状并能满足各级职能部门和普通大众对中文地址的建库、地址管理和维护、地名定位和查找需求的地理编码系统是非常有意义的。   本论文针对实现中文地理编码的关键技术,主要进行了以下几方面的研究工作:   论文第一章详细介绍了国内外在地理编码方面的进行的研究以及应用,并分析了国内外地理编码存在的问题,提出了研究中文地理编码的必要性。   论文第二章对地名数据库的创建及地址匹配与定位过程中需要用到的中文分词技术做了详细研究。介绍了中文分词的分类及常见的三种方法:最大匹配法、最小匹配法和逐词遍历法,以及三种典型的分词词典机制:基于整词二分法、TRIE索引树法、逐字二分法,并从时间和空间角度对三种典型的中文自动分词词典机制进行了比较分析。   论文第三章对分级地址模型及其构建方法进行了研究。首先介绍了地名数据库的内容构成,及数据组织原则,然后从概念模型、逻辑模型和物理模型三方面对分级地址模型进行了研究,最后给出了运用中文分词技术来创建地名数据库的详细步骤。   论文第四章对地址匹配策略及根据地址信息在地名数据库中查询地理坐标的方法进行了研究。介绍了地址匹配与定位的基本原理,讨论了地址匹配的策略及在地名数据库中查询的方法,并给出了实现地址匹配的详细步骤,介绍了地址定位的三种方式:定位到街道、定位到区域以及混合定位。   论文的第五章介绍了中文地理编码在MAPGIS7.x中从设计到实现的过程。首先介绍了地理编码的设计思想和总体框架,然后详细介绍为了实现地理编码模块需要在地理数据库中增加的主要接口及地名数据库的主要接口,最后给出了实现之后的部分功能截图。   论文第六章对本论文的研究内容进行了总结,并对未来研究方向做了展望。
其他文献
中国西南部青藏高原东缘处于我国几个著名的地震区和地震活动带上,又由于坡陡谷深,还是我国崩塌、滑坡、泥石流等地质灾害最严重的地区,地质灾害对环境、资源、财产等具有极大的
学位
人工智能是计算机学科的一个分支,二十世纪七十年代以来就被称为一起并称为世界三大尖端技术之一(空间技术、能源技术、人工智能),也被认为世界三大尖端技术之一(基因工程、
学位
互联网日新月异的发展,电子邮件已经成为信息化浪潮下人们信息交换的重要通信工具,同时企业树立企业形象,进行网络营销的企业级邮局也悄然升起。然而,由于企业中大量用户同时
学位
作为全球信息系统的万维网流行之后,信息剧增作为这个时代的特征已经被很多人所认同。随着科学技术的不断发展,越来越多的研究人员对各种数据产生了浓厚的兴趣。虽然表面上,它们
学位
20世纪末发展至今,P2P流媒体直播技术得到了广泛的应用。各种各样的P2P流媒体直播系统相继推出,P2P流媒体技术得到了广泛的关注,成为研究互联网的热点问题。P2P流媒体直播技术与
学位
粗糙集理论由波兰学者Pawlak Z于1982年首次提出。它是一种新的处理模糊和不确定性问题的数学工具,已被广泛应用于知识发现、机器学习、决策支持、模式识别、专家系统及归纳
当今信息技术突飞猛进,信息产业获得空前发展,信息资源呈爆炸式扩张。多尺度、多类型、多时态的地理信息是人类研究和解决土地、环境、人口灾害、规划、建设等重大问题时所必需
学位
随着物联网、云计算等新型应用场景的飞速发展,以及各类计算设备性能的大幅提升,终端平台所承载的敏感计算和用户隐私面临的安全威胁显著增加。传统的软件安全防护技术已无法抵
软件体系结构分析利用各种数学或逻辑的分析技术,针对系统的一致性、正确性、质量属性、规划结果等不同方面,提供描述性、预测性和指令性的分析结果。随着软件体系结构的作用从
学位
EPG,即Electronic Program Guide(电子节目指南),而九宫格EPG,就是具备横竖3排,一共有九个按键的电子节目指南系统,其中每个按键相对应一个功能模块,实现相应的功能。通过九宫格EPG
学位