基于条件随机场和空间推理的地理编码方法

来源 :解放军信息工程大学 | 被引量 : 12次 | 上传用户:thp2860051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地址信息与人类社会经济活动密切相关,在中国,工商、统计、公安等部门记录和保存了海量的地址信息。地理编码技术能够将包含空间位置的文本信息与空间信息建立关联,整合社会经济信息和空间信息,为社会经济信息提供定位、分析、可视化和制图等功能。从而在国民经济建设和人们社会生活中发挥不可或缺的作用。地理编码(GeoCoding),又称地址匹配(address-matching),是将文字描述的地址信息映射到地理空间中的过程,这个过程完成了具有空间位置的文字地址到地理坐标的定量转换。地理编码的核心是基于自然语言处理技术的地址语义解析和地址匹配。因此如何利用自然语言处理技术完成地址精确解析,并利用解析成果进行地址匹配是提高地理编码准确性的关键。本文以非规范中文地址为研究对象,将条件随机场模型运用到地址解析中,对地址中的空间关系进行总结并应用到地址匹配中。为非规范中文地理编码找到一条可行途径,也为中文文本空间信息处理、自然语言空间查询等研究提供了理论和技术借鉴。论文主要研究内容包括:1.通过介绍地理编码的需求背景和应用领域,阐述了本文的研究背景和研究意义;从地址标准规范、地址模型、地理编码系统构建和地理编码方法四个方面分析了地理编码的研究现状;针对存在的问题确定了本文的研究内容和研究思路。2.阐述了地理编码的概念和一般过程,指出地理编码中两个核心过程——地址解析和地址匹配;总结了地址解析三种方法体系——基于词典(规则)、基于理解和基于统计,提出基于条件随机场的地址解析;分析了地址匹配的三种方法体系——模糊匹配、层级地址精确匹配和空间推理匹配。3.构建了空间关系地址模型及其标注体系。在层级模型、有限自动机模型的基础上,提出了空间关系地址模型,并分析了该模型的优势;阐述了空间关系地址模型的结构,分析了各种空间关系的表达;基于HashTable构建了地址模型哈希树,并对地址标注语料库进行了地址模式统计分析。4.提出了基于条件随机场模型的中文地址解析方法。将条件随机场模型应用到地址解析中,提出了基于条件随机场的地址解析方法,并着重研究了地址标注语料库构建和地址特征选取。该方法不依赖于词典,避免了其他方法的标注偏置问题,并允许灵活加入各种特征,对非规范地址的地址解析和结构化具有较好效果。5.研究了基于空间推理的地址匹配方法。在地址解析的基础上,探讨了利用地址中的空间关系进行地址推理匹配,并重点介绍了针对几种地址表达模式的匹配策略和方法。该方法充分利用了地址中的空间关系信息,提高地址匹配精度。
其他文献
随着义务教育的不断深化改革与发展,我国小学阶段的教育及教学对素质教育的教学目标提出了更高的要求。因此,不断加强对学生学习方法的有效指导、不断培养学生的自主学习能力
近日,据日本媒体报道,日本正在考虑向冲绳群岛西南的本岛部署最先进的12式岸基反舰导弹,目的是保持对宫古海峡形成火力全覆盖。那么,日本强化西南岛屿的目的是什么?12式导弹
报纸
学前教育是整个教育体系中的重要组成部分,它为学生开创了一个良好的教育开端,所以家长应该重视学前教育,这在某种意 义上等同于关注国家未来。当今社会,城乡进一步地发展起
从美学的概念在鲍姆嘉通笔下确立,到蔡元培审美代宗教的思想提出,美育的话题在教育以及世界观的养成作用上一直起着不 可取代的作用,对于新时代的青年而言依旧如此,对于新的
随着素质教育改革的不断深入以及《中国学生发展核心素养》 总体框架的正式发布,核心素养培养逐步成为我国未来基础教育改 革的方向和灵魂。 2018年统编《道德与法治》新教材
本文从信息需求增长、信息需求现代化技术角度来阐述信息需求的变化。文章还从加强信息技术研究和信息服务来论述应该采取的相应对策。
在第24个全国“土地日”宣传月活动中,垦区建三江分局组织各基层国土所开展多种形式的宣传活动,取得了良好的效果。
2月10日,农垦齐齐哈尔管理局召开2015年国土资源工作及执法监察工作视频会议及时学习传达全省和垦区国土资源工作会议精神,认真贯彻落实,并对2015年国土资源工作进行了全面的安
近日,汤原县国土资源局召开了全县国土系统党的群众路线教育实践活动动员会暨第一次集体学习会。局机关全体党员干部、各乡镇国土所、所属事业单位人员参加了会议。
为了充分利用全国“土地日”宣传这一有利契机,大力宣传国土资源法律法规,切实提高广大群众守土有责的意识,牡丹江市国土资源局紧紧围绕“节约集约利用土地,转变土地利用方式”的