自动分词软件质量的评价模型

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zltxgl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语自动分词是中文信息处理的基础性工作。近年来,我国已研制了十多种自动分词软件,但尚无评价此类软件的模型和方法。本文针对分词软件的特点,提出了自动分词软件质量的评价准则,并对这类软件质量的两个重要特性(分词正确率和切分速度)给出了定量的度量方法。
其他文献
作文教学,一直是语文教师能回避且回避的问题;写作文,也一直是学生头疼的难题。怎样解决作文的"教"和"写"?关键是解决一个兴趣问题。给作文以形象,激发学生的作文兴趣。
传统的篮球课教学大多都是采用教师讲解、示范,学生练习的教学模式.而“导学——学导”教学法主要以直观形象(图解、篮球技术动作分析解说、教师示范)为先导,通过导学、自学自练、
中国科学技术大学与清华大学合作,在烯烃氢碳化反应及其应用中取得新进展。研究人员研发了一种镍催化的烯烃还原偶联反应,在硅烷的参与下,烯烃扮演了烷基金属试剂等价物的角色,参
摘要:高中数学比初中数学难度大,涉及的知识点更多,知识面更广。高中数学的学习是中学阶段的关键时期,不少学生升入高中后,很难适应高中数学的学习,在数学面前就像一个菜鸟,晕头转向。除了学习环境、教学方法等外部因素外,学生自身的内部因素也很多,同学们应该转变观念、提高认识和改进学法要想逆袭,学生要加深对数学的认识和理解、掌握科学的学习方法;老师要努力改进教学方法,活跃课堂气氛,培养学生对数字的敏感度及对
据美国透明度市场研究公司最新发布的一篇报告,2015—2023年的8年间,全球合成橡胶市场将以5.1%的年均复合增长率增长。这篇报告预测,到2023年,全球合成橡胶市值将达457.7亿美元,而201
本文提出的按汉字笔划权值为序对汉字词组的排序方法不仅有很快的运算速度,而且内存开销较少。文中详细介绍了汉字笔划权值的转换方法以及用汇编语言实现的技术要点,并给出了
巴塞罗那大学(UB)和两所澳大利亚大学的研究人员推出一种通过在反应分子之间应用电场来催化化学反应的新方法。这将开启以快速和廉价的方式,制造用于医药产品和材料的化合物之门
德克萨斯大学阿灵顿分校的信息化学家MacDonnell等最近公开讨论的课题为阳光发电伴随的能量存储和分布。MacDonnell和他的团队开发出一种利用阳光、
本文介绍了汉英机器翻译系统(CETRAN)中从中间语言生成英语的生成系统的词汇结构,在逻辑上描述了生成系统各个层次之间的生成原理,并提出一种应用于生成系统的转换方法——词
本文初步分析了中文文本的存储结构特征,并将其应用于文本压缩,对LZW(Lemple Ziv Welch)算法进行了两方面的改进:1、采用变码长编码,对短文本的压缩有显著的效果;2、建立—删