【摘 要】
:
汉语的自动分词,是计算机中文信息处理领域中一个基础而困难的课题。该文提出了一种将汉语文本句子切分成词的新方法,这种方法以N-gram模型为基础,并结合有效的Viterbi搜索算
【机 构】
:
华南理工大学工商管理学院,华南理工大学电子与通信工程系
论文部分内容阅读
汉语的自动分词,是计算机中文信息处理领域中一个基础而困难的课题。该文提出了一种将汉语文本句子切分成词的新方法,这种方法以N-gram模型为基础,并结合有效的Viterbi搜索算法来实现汉语句子的切词。由于采用了基于机器学习的自组词算法,无需人工编制领域词典。该文还讨论了评价分词算法的两个定量指标,即查准率和查全率的定义,在此基础上,用封闭语料库和开放语料库对该文提出的汉语分词模型进行了实验测试,表明该模型和算法具有较高的查准率和查全率。
其他文献
本文以江西省中药产业的发展现状为背景,阐述了建设赣南地区中药科研服务平台的重大意义,并提出了一种新型的基于B2O2C(企业—科研机构—消费者)的电子商务模式,重点说明了基
电大开放教育发展至今已有37年,随着现代化信息社会的发展,近些年无纸化办公方式在教学管理方面发挥着越来越重要的作用。主要体现在报名、入学考试、管理过程、形考成绩、考
目的:探讨胸主动脉病变腔内支架修复术"烟囱"技术的临床应用。方法:对2009年12月至2012年12月间,44例经"烟囱"技术治疗的胸主动脉病变患者临床资料,适应证及手术实施要点进行
我国卫生监督体系经历了从无到有,从集执法、科研及技术服务于一体的卫生防疫机构到独立组建卫生监督机构的沿革。在实行“法治社会”治国方略的总体方向和强调公共卫生体系
从1978年中国进行改革开放三十多年来,酒店业随着改革开放进程的深入而发展迅猛,在国民经济中处于重要地位。然而,酒店业近几年来所经历的跨越式发展却也暴露了一些问题,其中
顺鑫农业是北京市第一家农业类上市公司,也是中国食品工业百强企业及中央储备肉定点代储企业。经过20年的对公司治理的不断总结和优化,公司在信息披露、安全生产、市值管理等
在现代组织中,工作满意度的高低直接决定员工所表现出的角色外行为的类型,但会受到个体与组织之间心理契约的调节与控制。以心理契约作为两者之间关系的调节变量,采取滚雪球
本文以推动农村经济发展为出发点,对小城镇建设与发展为农村经济发展带来的机遇以及挑战作出了分析与探讨。
目的分析护理干预对老年糖尿病合并肾病尿毒症的影响效果。方法资料随机选择2013年8月—2014年8月该院诊治的DN尿毒症患者98例,随机分成两组,对照组49例给予常规护理,研究组4