【摘 要】
:
目前,基于知识库的系统已成为自然语言处理研究的重点.而自动构建知识库正是这个重点中较难的部分.该文研究的是:利用自然语言处理的方法从大量文本中自动获取词汇知识.从知
论文部分内容阅读
目前,基于知识库的系统已成为自然语言处理研究的重点.而自动构建知识库正是这个重点中较难的部分.该文研究的是:利用自然语言处理的方法从大量文本中自动获取词汇知识.从知识来源、获取方法、知识表示等方面进行了详细地阐述和探讨,并重点提出了两个词汇知识获取的算法.在分析算法思想、阐述算法过程的基础上,分别对两个算法进行了实验,并对实验结果作出详细的分析,提出了改进的办法.该文的创新工作和结果主要有:(1)提出了两个词汇知识获取算法,为自动构造义类词典打下基础;(2)将认知心理学中的层次记忆模型引入词汇知识获取中来,突出了认知和文本语义之间的密切联系;(3)将以词权重作为文本特征进行文本分类的思想运用到词汇关系的获取中,从已分类的文本集出发,找到代表性的词语,并根据文本分类的层次构造出层次性的词关系;(4)运用了语言的表层信息,突破了自然语言处理中纯统计方法和基于复杂规则(如句法分析)的方法的局限.(5)将语言表层信息与专家系统外壳的推理机制结合起来,为基于规则的自然语言处理找到了一种切实可行的解决办法.
其他文献
南方稻田休闲期是稻作季后残留氮素转化的主要时期,其存在时段长、秸秆还田和稻季养分残留等问题,对N2O排放的影响尚不清楚。很少研究对稻季后休闲期进行连续观测,这就导致我们
过去,由于教学方法单一,导致课堂效率较低,从而影响到学生对知识的理解和掌握,更无从谈能力培养了。如何提高课堂的教学效率,如何在有限的课堂时间里最大可能地调动学生学习的注意
软件无线电是20世纪90年代出现的一种实现无线通信的新的体系结构.它的基本思路是把硬件作为无线通信的基本平台,而把尽可能多的无线及个人通信功能用软件来实现.该论文对软
博士后期间的研究工作是:研制用于远距离微小振动测量的干涉系统.以此为中心,做的主要工作有:●建立基本的光学实验室;●查阅文献,确定所要解决的根本问题,并以此确立系统方
汽车牌照识别(Car License Plate Recognition,CLPR)系统是智能交通管理系统中的重要组成部分,在电子收费、车流监控、出入控制等场合有着广泛的应用.该论文对项目组研究开发并
该文主要在用户电网实是监测与控制方面开展了以下工作:该文首次提出了一种基于电磁变换原理的电网谐波检测新方法.为实现对用户电网的数据分析以及对用户电力调节系统运行性
生物膜是生命活动中许多重要反应发生的场所,细胞的能量转换、信息识别与传递、物质运送和分配等基本生命现象都与生物膜密切相关。而在生物膜中,发挥这些生物功能的主要物质
该论文对与设计高线性、高效率功率放大器的相关问题进行了研究,主要分为以下几个部分内容.1、选取高性能的器件.通过对功率放大器常用器件的综合性能进行比较,我们选取了GaI
目前,建立生态补偿机制正成为国内社会各界的热点问题,然而理论研究中对生态补偿的概念、内涵、补偿标准、补偿方式、补偿资金来源等核心问题尚不清晰,这使得生态补偿难以纳入社
跨损伤DNA合成(TLS)是生物机体面对DNA损伤的一种应急性机制,在复制叉遇到损伤而无法通过时,能够在损伤DNA对面直接合成DNA,从而跨过损伤。由于TLS聚合酶保真性较低,容易引入突变