基于规则和统计相结合的方法处理甲骨文信息

来源 :第三届HNC与语言学研究学术研讨会 | 被引量 : 0次 | 上传用户:shyandi123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分词和词性标注是计算机处理甲骨文信息的基础。在现阶段,建立起一个成熟的、带有词法语法标注信息的甲骨文语料库是极其困难的,这也给运用统计方法处理甲骨文信息带来了不便。本文介绍了甲骨文电子化的基本情况和甲骨文字典的建设情况;在此基础上,尝试运用统计、规则以及统计和规则相结合的方法进行甲骨文分词和词性标注工作。简单地说,统计和规则相结合的方法步骤如下:(1)结合甲骨文字库运用统计方法进行分词或词性标注;(2)消歧;(3)如果(2)中低于某一阈值则调用规则库进一步处理。实验表明,用规则和统计相结合的方法进行甲骨文分词和词性标注效果都要优于单纯的规则方法或统计方法,尤其是在语料库过于稀疏的情况下。文章的最后,简单探讨了如何利用标注的结果用规则的方法来完成语法分析。
其他文献
本研究考察了普通话后字调系统中存在的两类音高调节现象:(1)出现于普通话某些声调组合中的音高降阶现象;(2)普通话焦点重音所激发的音高升阶现象、提阶现象和落阶现象。通过研
本文试图描述在HNC理论发展的三个阶段概念符号表示的变化。HNC概念符号表示式由高层、中层和底层构成。《理论》阶段主要对此进行文字表述,《定理》阶段则给出符号表示式(HNC
会议
分析目前国际上在总承包项目中普遍采用的试车组织运行管理模式(EPC/TurnKey)及运作方式;归纳EPC/Turn Key模式下试车管理的特点.比较国内工程公司采用的EPC管理模式,找出其
文章通过2005年汽车市场形势的分析与评价,对2006年汽车市场的形势进行判断与预测,提出汽车企业应该把握的关键点: 1.汽车价格持续下降导致成本优势从2005年起将成为整车厂
省略是基于简约的原则而略去了句中的某些成分,本文运用HNC句类及句类知识考察了句子的省略类型,省略成分与恢复成分对应关系,并给出了JKl省略恢复的判定规则。为计算机处理省略
通过对核心员工概念与界定方法的描述 ,阐述核心员工是创造企业核心竞争力的源泉这一基本观点 ;对企业如何甄别核心员工及如何留住、激励核心员工这一深层次问题进行探讨.“,
交互引擎的实现需要大量的形式化知识库提供支持,领域句类知识库就属于其中重要的一个知识库。领域句类知识库以领域句类表示式的方式将不同领域的世界知识提供给计算机使用,对
会议
句群是HNC对段落、篇章处理时在句子和段落之间加上的一个过渡层次。本文将从理论上探索HNC语境单元萃取实现过程,并以一段真实的新闻语料为例,阐述两个领域句类代码及蕴含的领
通过问卷调查等方法研究青年科技人员流失的原因 ;分析了青年科技人员对企业有更高的要求、注重自身事业发展等特点 ;针对如何稳定和激励青年科技人员提出了具体建议.“,”Fo