全切分的汉语自动分词方法

来源 :山东工业大学 山东大学 | 被引量 : 0次 | 上传用户:loganmax
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语自动分词是目前中文信息处理中的重要环节,它是中文自然语言理解、机器翻译中基本的步骤.汉语自动分词的难点在于歧义字段的切分.该文从考查现有的几种主要的分词方法入手,分析了它们的特点并指出其存在的切分盲点,由些提出一种消除分盲点的方法-全切分算法.即在分词层给出所有符合词典的切分形式,经过句法语义分析后得到正确的切分结果.考虑到输入与匹配的先后关系,研究小组设计了两种全切分算法,边输入边切分的并行全切分和输入完毕再进行切分的串行全切分.其中串行全切分又分为增字和减字全切分.
其他文献
该文介绍了一种电子线阵B超仪图象处理系统.在该系统中,通过超声回波法获取信息,该信息经多级放大,噪声抑制及检波等处理,经A/D变换成为数字信号并经DMA接口读入计算机内.在
该论文在特定域软件结构理论的基础上,对构件化应用软件开发方法和以CI软件系统应用为特定域的CI基础构件的设计和组装进行了研究.论文提出了一种能快速实现用户目标的构件化
随着因特网安全问题的日益突出,网络安全核心设备Internet防火墙技术也在不断发展.从安全性角度衡量,基于代理的防火墙系统较其它类型具有更高的安全性;现代防火墙系统发展的
该文提出一种新的Internet嵌入技术的体系结构,即基于组件思想的使用双层网关技术的Internet嵌入技术模型,该模型解决了多种不同类型的设备同时嵌入到Internet的技术,解决了
软件组件结构是继过程模型和面向对象模型之后软件工程领域中又一新的设计模型.在该模型下,应用程序由组件、框架和对象总结构成.JavaBeans把组件技术引入了Java平台.组件是
随着Internet的发展,Web数据库在最近几年也得到飞速进步.该文首先分析了传统的Client/Server结构特点及在Web应用程序开发中存在的缺陷,并在此基础上提出一种新型的计算结构
该课题取自于军事预研项目"成像雷达实验系统研制".文中详细讨论了JPEG静态图象数据在网络上的传输处理方法,系统以WINDOWS95为平台.前两章简单介绍了相关技术的发展概况以及
该文系统地研究了在模糊环境下的机器学习重要分支—示例学习理论、算法及其应用.以Zadeh的模糊集理论为基础,该文建立的示例学习模型吸收处理了存在于人类思维、感觉、认知
由于高技术的发展和未来社会人们对信息的需求,特别是国际互联网的迅速发展,网络运行速度和网络连接方式越来越成为国际计算机网络界共同关注的问题.远程以太网的构想将传统
民自动化是一个新的技术领域,该论文主要介绍了配电自动化(DMSA)的重要组成部分-变电站综合自动化(ISA)的设计与实现.其主要设计原测为:结合网络技术及Internet/Intranet标准