基于多级内码的分词理论及其应用的研究

来源 :山东工业大学 山东大学 | 被引量 : 0次 | 上传用户:Melissachen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文从词典的建立,分词的过程,系统地提出了一套基于多级内码和ATN网的分词方法.文章重点论述并模拟了分词的算法.该分词方法包括两部分:求解各种分解方式和对各种方式的切分.同时该文提出了用文法构建ATN的算法和求解ATN的First集的算法,在该文的方法中,使用了一些规则和格辨理论提高分词的效率.作为我级内码理论的应用,该文设计实现了一个MCTI系统.
其他文献
该文来源于深圳宇龙计算机通信科技有限公司软件部开发的PPS-HIGHSYSTEM系统.该系统以邮电部1996年颁布的《高速无线电寻呼系统联网协议》为标准,遵从邮电部《高速无线电寻呼
COSIX是一个国产UNIX操作系统.为了使之得到普及并方便广大用户学习和使用COSIX系统管理,迫切需要一个能实现COSIX主要系统管理工作的易于操作的软件.为此,研究人员承担了国
该文介绍了一种基于矢量量化技术的话者识别系统.用由线性预测分析获取的倒谱系数反映静态倒谱信息,用在时间窗内对静态倒谱进行最佳线性匹配获取动态倒谱信息.静态、动态倒
伽玛照相机是一种大型核医学影像诊断设备.它是一种能反映放射性核素在人体内分布的显像设备,可以显示人体的骨骼和体内的脏器,并能连续动态显示人体心血管、脑血管等器官的
该论文以中国网络应用为背景,进行了网络边界服务和虚拟专用网的探讨,尝试探索适合中国国情的虚拟专用的技术解决方案,完成了VPN的体系结构和虚拟状态机,探讨实现了虚拟专用
同音词的智能识别是一个具有重要研究价值和应用价值的研究方向,机器词典作为其中的基础资源和判别依据,在整个同音词识别系统中具有重要的作用.该文首先概述了汉语同音词识
对不确定性规则进行求解,由于在对逻辑规则进行示解过程中,有些关系代数的运算操作不再适合使用,因此作者将关系数据库运算扩展为概率数据库运算,并对概率计算有影响的关系运
网格是继传统互联网、Web之后的“第三个信息技术大浪潮”,网格以提供高质量的服务为中心、以资源共享任务协同为目的,旨在为科学研究、工业制造、日常生活等构建可信赖的高品
该文较为详细地分析了企业管理信息系统的研究现状,综合比较了管理信息系统发展过程中几种模式,将目前最先进的管理思想ERP与最科学的C/S/S信息系统结构创造出的融合为一体,
随着信息技术的迅速发展,特别是因特网的普及,网络设施和信息资源对于国家、企业和个人都是极其重要的,网络安全及入侵检测系统已成为计算机领域的重要研究课题。基于数据挖掘和