【摘 要】
:
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名
【机 构】
:
福州大学福建省空间信息工程研究中心,空间数据挖掘与信息共享教育部重点实验室;
【基金项目】
:
国家科技支撑计划课题(2007BAH16B03);福建省科技重大专项专题项目(2006HZ0001-1);福建省科技计划重点项目(2008H0046);AMD合作项目奖励基金
论文部分内容阅读
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。
其他文献
质量安全是关系民生、稳定和发展的核心问题,除了依靠传统质量监管模式以外,更应通过创新社会管理来解决。受制于各种历史的和现实的原因,特别是由于企业诚信缺失、法律制度
有序的政治参与作为公民行使政治权利的基本途径,是衡量一个国家民主政治发展状况的重要尺度,是政治文明建设的内在要求和推动力。我国公民政治参与的总体水平仍然比较低,政
在新的时代、新的时期、新的任务面前,要繁荣与发展学术文化,必须高度重视传统的基础的学科建设。中国文学史的研究就是这样的学科建设。在20世纪,已出版的各类文学史著作,总
文化产业作为一种"朝阳产业",已成为推动经济增长,增强地区和城市综合竞争力的重要因素。文章使用灰色关联模型,运用重庆市2006-2010年相关数据,分析了文化产业增加值与其影
目的:观察早发急性ST段抬高型心肌梗死(ST-segment elevation myocardial infarction,STEMI)患者的临床特征、主要心血管不良事件(Major adverse cardiac events,MACE)的发生
用Gompertz、Bertalanffy及Logistic模型拟合4~39月龄的澳洲波尔山羊生长模型。结果表明:Logistic模型拟合效果最好(R2>0.98),公母羊生长模型分别为:W=51.59×(1+6.15×e-1.82
对焰色反应实验进行改进,使实验仪器更廉价、易得,操作更简便,现象更明显。
目的:通过动脉自旋标记(Arterial spin labeling,ASL)与氢质子磁共振波谱(Proton magnetic resonance spectroscopy,1H-MRS)技术,检测脑出血急性期患者血肿周围水肿区局部血
互联网时代的到来改变了传统的阅读方式、拓宽了更多的阅读渠道,资讯的获得也变得更加容易,传统纸质版杂志因此受到不小影响,对于以精美画面取胜的时尚类杂志也产生了巨大冲
生物监测是一种新型的监测技术,被认为是未来监测技术的重要方法,但由于其方法本身、技术的原因,限制了其应用.随着水环境污染状况的日益加剧,对水体环境的监测以及水体安全