基于NFA的蒙古语词法分析算法研究

来源 :第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 | 被引量 : 0次 | 上传用户:riyueshen1969
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蒙古语是黏着性语言,其构词和构形是通过词根、词干上连接不同的词缀来实现的,从理论上讲蒙古语词汇是无限的,因此词典中不可能包罗所有的单词和其诸多的形态变化。研制一套独立、高效的词法分析软件来识别和生成词语以及其形态变化是非常有必要的。我们在本文中介绍了一种蒙古语词法分析器,该分析器采用了基于有限状态自动机的分析算法解决了未登录词识别、非词检查、复合词识别等问题,并大大提高了分析速度,在现代蒙古语句法分析软件中试用后发现与单纯的基于词典或规则的算法相比在速度上提高了将近两个数量级。
其他文献
基于向量空间模型的信息检索技术中,用向量空间模型来表示Web文档,以索引词权重作为主要依据进行用户查询与Web文档之间的相似度计算,并根据相似度大小进行查询结果的排序。
会议
土木工程中,地基的加固技术和结构设计至关重要。本文首先分析了土木工程的结构设计其中包含混凝土结构设计、剪力墙结构设计、承重墙结构设计,其次地基加固技术的在土木工程技
目前房屋建筑工程中主要是采用混凝土施工技术,有效地提高了房屋建筑施工的质量,但是在施工过程中仍然存在一些问题,影响居民生活。本文结合自身的工程实践经验和施工技术的特点
笔者对蚌埠市郊区太平、汪圩等4所小学处于替牙期、但牙期学生2110名,进行了错畸形调查。被调查者年龄为8-14岁,其中男生1126人,女生984人。在室内自然光照射下作口内直视检查。
研究维、哈、柯多文种信息检索中web文本分类问题。根据维、哈、柯Web文本具有结构信息的特点,提出了分类系统框架,采用了基于KNN的Web文本分类方法,并结合具体实验在对数据
水利工程施工中,金属结构焊接是施工中的关键工序焊接质量的好坏不仅关系到工程的安全经济运行,而且也体现了水利施工企业安装水平的高低。本文简要分析了水利金属结构的刚焊缝
软土含水量高、压缩性高、灵敏度高、承载力低、物理性质极不稳定且易发生变化,这种深基坑变形的情况是一个非常复杂的过程。目前,研究软土基坑变形应力主要集中在研究和应用中
本文首先介绍了蒙古文附加成分的切分方法,然后描述了改进的蒙古文自动词性标注系统的总体结构,最后以规模为95万词的语料库作为训练语料,对5万词的测试文本进行了一级标注,
本文主要讨论在Cygwin的环境下利用SRILM工具包建立基于词的阿拉伯文和维吾尔文语言模型并在语料库上进行测试。为了解决数据稀疏问题,我们主要研究几种平滑算法。我们采用“
我国建筑行业发展属于粗放型,资源消耗量相对较大,利用率不高,与可持续发展理念相违背。随着社会的不断发展,绿色环保理念逐步深化,对建筑工程施工技术提出更高的要求与标准,为满足