一种基于复合特征的中文地名识别方法

来源 :武汉大学学报(信息科学版) | 被引量 : 2次 | 上传用户:zhangwenjiekao1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文地名识别是命名实体识别的重要研究课题之一,也是提高地理信息系统应用水平的关键。传统的地名识别主要基于词性或地名要素特征,特征类型有限。提出了一种基于复合特征的中文地名识别方法,挖掘中文地名在自然语言中的特点,设计了类型、路径、距离和数量四种句法特征,基于地名要素特征、词性特征、句法特征三种复合特征利用条件随机场模型实现了中文地名的训练和识别。通过实验对比复合特征在中文地名识别方法的效果,结果表明复合特征能够有效提高中文地名识别的准确率和召回率,尤其是对于复杂地名的识别,具有良好的效果。
其他文献
玉米作为我国农业经济中的重要农作物之一,在种植过程中会出现很多的病虫害,面对这一情况我们呢需要进行细致的分析得出有效的防治措施,只有这样才能确保玉米稳定的高产量,从
期刊
随着《上海市城市总体规划(2017—2035年)》的获批以及"建设用地负增长"规划目标的明确,上海正式进入存量发展阶段,城市更新将成为未来城市建设的主要方式,构建与完善上海的城市更新体系成为急需面对的问题,在对上海城市更新体系现状进行梳理和总结的基础上,通过借鉴深圳、香港和台北的相关经验,提出构建和完善上海城市更新体系的思考,将上海的城市更新体系归纳为目标体系、政策法规体系、组织体系、规划编制体系
振动检测是提前发现旋转设备缺陷的先进措施,为预知性设备检修提供了有效的手段。某厂卷取机齿轮箱打齿故障的发现是1次典型的利用振动检测提前发现并及时处理故障的范例,为
研究了VDMOS器件存在异常峰值电流的原因,提出了解释此现象的理论。异常峰值电流的大小由VDMOS元胞在P+body区之间neck区的界面状态决定。一般MOSFET不具有此特殊结构,因而不
目的探讨1例永久性新生儿糖尿病患者的致病基因及其致病机制。方法对2013年8月北京协和医院诊治的1例永久性新生儿糖尿病患者,分析其临床特点并抽提相关家系成员的基因组DNA,聚合酶链反应(PCR)扩增后进行葡萄糖激酶(GCK)基因直接测序。构建野生型和突变型质粒,体外表达并纯化GCK重组蛋白,进行酶动力学和热稳定性分析。两组间数据比较采用t检验。结果在该新生儿糖尿病患者发现GCK基因c.571 C>
目的讨论肱骨近端骨折的手术治疗方法.方法 2000年1月至2004年12月,手术治疗有移位的肱骨近端骨折127例,其中内固定手术114例,肱骨头置换手术13例.男48例,女79例,年龄21至75
计算机实验室是高校开展各项教学科研任务的重要部门,是高校的重点建设项目之一,是大学生进行实践创新的主要场所.目前,高校实计算机验室普遍存在资源利用率低、资源分布不均
期刊
介绍了全部采用我国技术制作的地球辐射表.详细论述了该表的工作原理,关键部件--硅罩的透过性能,测温元件的选择以及辐射补偿线路.