基于全文检索技术的POI地址匹配引擎研究及应用——以滨海新区RIA-GIS政务办公辅助平台为例

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:juejue_wang11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随着地理信息系统技术的应用深入,政务GIS平台层出不穷,政府内部存在大量零散的业务数据无法直接在地理信息平台上集成,基于空间位置的搜索服务成为最迫切的需求,而这一功能是以地址匹配技术为支持的。本文在回顾已有地理编码技术的前提下,结合我国现有的基本国情,从用户需求角度出发,提出基于全文检索技术的POI地址匹配引擎设计思路,从技术、实现和应用三个方面做了详细的阐述。利用全文检索技术创建POI地址匹配引擎的核心思想在于:通过分词索引的建立,将拆分后的地名地址要素根据词频趋势赋予不同的角色,并以此评定其重要程度,从而作为确定匹配度的一个重要参数。   论文的主要研究成果如下:   第一,通过对目前地理编码和全文检索技术的发展和应用现状,提出基于全文检索技术构造POI地址匹配引擎思路的可行性,根据匹配量和匹配性质的不同组合,将POI地址匹配引擎分为四类:精确单项匹配、精确批量匹配、模糊单项匹配、模糊批量匹配,并分别针对四类匹配提出不同的性能评测标准。   第二,定义了POI“地名地址信息”,并分析其特点。通过实验确定分词器的选择标准,利用向量空间模型来实现模糊匹配的相关度评分,分别就不同的匹配方式,设计合适的匹配算法。特别针对模糊批量匹配,提出a指数(最佳结果判定阈值),并就a指数的经验取值做了测试。测试结果显示,POI地址匹配引擎在效率、用户输入自由度、结果可调性上都优于一般的匹配引擎。   第三,利用面向对象的编程技术,对算法进行封装,实现了POI匹配引擎。以滨海新区GIS政务办公辅助平台为例,将POI地址匹配引擎嵌入到Flex/J2EE的平台上,并针对批量匹配的网络传输效率问题,提出切实解决方案,达到较好的应用成效。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
学位
赤潮灾害在我国海域频繁发生,对海洋生态环境、水产养殖、渔业、旅游和人类的健康安全构成了严重威胁,已成为沿海地区重要的环境问题。因此,识别赤潮有害藻种对于有效的监测、防
在全球变暖的背景下,土地利用变化的气候效应已逐渐成为学术界关注的焦点。土地利用变化可通过改变陆地表面的物理性质来影响气候,这种生物地球物理机制在较小的空间尺度上甚至
本文以内陆湖泊水体(主要以太湖)为研究对象,建立一整套适用于多时相太湖水体的反演方法,包括统计回归模型、生物光学模型的反演模型以及基于生物光学模型的光谱匹配算法等,同时对
生态系统多样性的平衡与健康,关乎着生态、水资源、食物安全以及人类健康等社会经济的稳定和可持续发展。如何充分利用离散的观测数据,通过对维管植物物种丰富度及其与生境因子
我国是一个多山的国家,山区面积占陆地总面积的三分之二。显著的季风气候、空间和时间上分布不均的高强度降水、复杂的地形地貌及山区河道较弱的调蓄能力导致了我国山洪灾害的
室内空气污染是指由于人类活动或自然过程引起的某些物质进入室内空气中,呈现出足够的浓度、持续足够的时间并因此危害了人类的舒适、健康的现象。生物燃料的燃烧能造成室内空
现代烟草农业,就是利用先进科学技术,运用科学生产方式通过加大生产要素投入,提高土地产出率、资源利用率和劳动生产率,实现规模化种植、集约化生产、专业化分工和信息化管理,达到
蓝藻分泌的胞外聚合物(EPS)对污染物在环境中的迁移有重要影响,但对影响EPS性质的环境因子及EPS在环境中的稳定性、可降解性等行为还不清楚,EPS对土壤矿物吸附重金属的影响也