基于错误驱动的术语间概念关系自动提取技术研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:linjinlong19880927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Ontology(本体)作为一种表达领域知识的手段,正在计算机科学的各个研究领域中受到越来越多的重视,并在许多领域得到广泛的应用。从自然语言处理的角度来看,构造领域Ontology的关键技术包括术语自动提取和以此为基础的术语概念关系自动提取。国内外对术语自动提取的研究已经颇具规模,相比之下,对术语概念关系自动提取的研究还处在起步阶段,因此有必要进一步探索术语间概念关系的自动提取方法。 本文的研究重点是术语概念关系的自动提取方法,通过对常用术语概念关系自动提取方法的详细分析,确定了基于规则的错误驱动方法的算法设计、原型系统实现和性能改进策略。论文使用基于规则的错误驱动的方法自动获取术语概念关系,在错误驱动的过程中不断调整提取规则以提高关系提取的准确率和召回率,同时自动生成一个新的提取规则库。进而,论文尝试结合统计方法和规则方法对错误驱动的方法做改进,在系统中加入互信息对生成的新规则进行合并和优化。实验结果表明,规则的合并可以提高系统的准确率和综合评价值。最后在对实验结果进行分析的基础上,本文对术语概念关系的自动提取提出了进一步的展望。 本文通过对术语间概念关系自动提取方法的分析和实践,提出了一种可行性比较强效果也较好的方案——基于规则的错误驱动的方法,并通过加入统计方法对错误驱动的方法进行了改进,得到了较好的关系提取效果和规则获取结果,在术语间概念关系的自动提取和关系提取规则的自动生成两方面进行了有意义的尝试。
其他文献
本文探讨了ABC方法的关键阶段——基于体系结构的构件组装的相关问题和工具支持。软件构件技术和软件体系结构的蓬勃发展,促使了ABC方法的提出。ABC方法将自顶向下的软件体系
随着软件技术的发展,人们越来越关心软件产品的非功能属性,如产品的易用性、高效性、可靠性以及安全性等。同时在一些大型软件系统中,非功能性需求的重要性远远超过功能性需求,例
软件构件库是对可复用软件构件资源进行管理并对软件构件的复用提供支持的基础设施。它主要提供构件描述、分类、发布、存储、检索、反馈等构件管理功能。其中,构件反馈是收集
随着计算机技术的日益发展和计算机应用的不断普及,特别是计算机网络与无线通信的广泛使用,计算机网络与移动终端设备的结合已成为新一代通讯的发展方向,而互联网上Web信息的浩
当前,计算机信息处理技术深刻地影响了现代人的生产生活。以办公套件作为解决方案的办公自动化大幅度提高了工作效率,改变人们的办公方式。长期以来,中国一直将办公套件作为重要
复杂文本布局引擎是操作系统与大型应用软件不可缺少的重要组成部件。作为复杂文本布局引擎,无论是Windows的Uniscribe还是OpenOffice采用的ICULayout Engine,它们都对计算机正
阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题。目前互联网上大多数的信息都以英文形式存在的,随着中文网络用户的不断增多,迫切需要一种能够帮助中文用户查
随着互联网的发展和普及,信息量正以指数规律飞速地增长。对于普通用户来说,Internet上的“信息迷航”和“信息过载”现象已经成为日益严重的问题。而文本摘要技术正是解决这一
计算机视觉通过对图像的理解来模拟人类视觉,具有应用广泛、发展前沿等特性。大数据时代,图像资源急剧膨胀,给人们工作生活带来了便利,但是从繁杂多变的图像资源中寻找有价值的图
移动数据库系统本质上是移动的、异构的、多数据库系统。移动计算环境具有一些新的特性:移动性、网络断接的频繁性、网络条件多样性、网络通信带宽和费用的非对称性:此外移动计