基于百科词典的知识获取系统的研究与实现

来源 :第一届学生计算语言学研讨会 | 被引量 : 0次 | 上传用户:conglishan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从各种自然语言文本中获取知识是自然语言处理技术的重要应用.本文描述了从百科辞典文本中获取知识的探索性的研究工作,介绍了一个实验性的,限定范围的百科辞典知识获取系统.具体工作包括:利用分词工具进行初步的词条分类;在词条分类的基础上,对处理范围内的词条文本进行观察,以人工方式归纳其中目标知识的基于语义特征的模式规则;利用YACC工具对模式规则进行解释,进而抽取目标知识.文中给出了试验结果及分析.
其他文献
离合词是汉语中很有意思的一个词类.本文把离合词分为四类,探讨了离合词在汉英机器翻译中的分析,表示翻译等处理策略,并作了初步实现.
由于传统文化观念的影响、彼此信息的非对称性以及打工经济导致信贷主体的缺失,小额信贷在少数民族地区受到了一定的制约。为此,促进民族地区文化观念的转变、巩固民族地区借
山东黄金集团三山岛金矿新立分矿副井,现采用JKM-2.8*4(Ⅰ)E型多绳磨擦井塔式提升机,首绳为4根6V*33+FC,左右捻各2根,绳径φ28mm,绳长730米,井深693米,最深中段为-667中段.
期刊
句法分析是自然语言处理和机器翻译的基础.目前头驱动英语句法分析模型是公开发表的效果最好的模型之一.本文分析了头驱动模型的特点,并针对其不足提出了用极大熵原理估计依
在文本聚类中,聚类的最终结果应该是一棵树的形式.然而,随着互联网的普及,面对海量的电子文献,学科分枝的越来越细化,树的分枝粒度越来越小,逐层聚类必然会花费巨大的时间.本
本文提出一种词性标注规则自动学习算法.通过对规则进行评价、优化,有效提高标注正确率和标注效率.系统对PFR标注语料库(98年1月)进行标注,相对于NA假设的词性兼类消歧模型标
随着web的普及,信息过滤技术得到越来越广泛的应用.本文介绍了基于内容和基于协作的两种不同的过滤方法;描述了信息过滤中的关键技术,包括用户兴趣文件的表示、建立、维护和
年年两会谈房价,今年两会也不例外,惟一的改变是,谈的人更多了。在全国政协的各项提案之中,关于房地产市场的提案几乎占据半壁江山,而其中对保障性住房、物业税征收以及房地
(二○○九年六月八日)这次全军部队卫生工作会议,以科学发展观为指导,按照《全面建设现代后勤纲要》总要求,围绕全面推进部队卫生建设,总结过去,谋划未来,是一次十分重要的会