面向知识库的实体关系语义映射技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lin901102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体关系的语义映射是将自然语言文本中的关系指称项与知识库中的属性关系建立语义关联的技术,是大规模知识库构建、语义搜索等应用的重要支撑技术之一。随着开放式信息抽取研究的逐渐深入以及知识库资源的不断丰富,关系映射成为自然语言处理领域的研究热点。  在对关系指称项进行语义映射时,有两个难点问题:一个是关系语言表达的多样性往往导致关系指称项和属性关系间表述不一致;另一个是关系短语的歧义性经常导致同一关系指称项可以指向知识库中的多种目标语义。本文主要针对关系映射中的多样性问题展开研究,同时对歧义性问题也进行了探索,主要工作和创新点归纳如下:  1、融合实体对信息和关系名称变形扩展的关系映射方法因为知识库中的属性描述已经提供了很多语义关系,因此本文借助已有知识库中预先定义好的属性名,将关系指称项的映射到知识库中相应的属性名上,从而实现语义推断。由于关系指称项在表达目标语义时的各种变形以及巧合匹配等问题,需要关系映射算法既能捕获不同表述下的潜在语义,又要能处理各种变化带来的干扰。在处理这个问题时,现有方法只关注构成关系语义的两个实体,即根据这对实体来判断它们共现时所表达的关系语义。本文认为,关系指称项的语义并不仅仅依赖于与其关联的那对实体,还依赖于表达关系的关系指称项本身。据此,本文提出了融合实体对信息和关系名称变形扩展的关系映射方法。具体地,首先对知识库中的属性关系进行同义扩展,并将扩展后的同义词集合与关系指称项进行语义匹配,把这个结果通过Stacking技术与实体对信息相融合来实现关系映射。在PATTY数据集上的实验结果显示,关系映射的平均正确率可以达到0.744,在性能上比现有依赖实例的方法提升了0.245。  2、关系映射的生成式模型现有方法进行关系映射时,通常将知识库中具有特定属性关系的实体对回标到文本中,并利用数据冗余信息进行关系语义推断。这样的假设只利用了与关系指称项共现的实体对信息,而忽视了其他信息,因此效果并不理想。基于以上分析,本文提出了关系映射中三个重要特征:语义关系本身的流行度、实体对对语义关系的指示度以及关系指称项与实体对的共现度,并通过一个生成式模型将上述三个特征融合在一起进行关系语义映射。实验数据采用了从维基正文中抽取出来的开放关系三元组和维基信息框中的属性关系三元组。实验结果显示,该方法关系映射的平均正确率可以达到0.88±0.02。  3、基于图算法的关系映射由于关系语言表达的多样性和关系歧义问题的存在,融合尽可能多的不同角度的特征对映射性能非常关键。然而,现有的关系映射方法对映射中的资源的利用并不充分。本文发现以下特征对关系映射非常重要。它们是:关系指称项和属性关系的共享实例、实例是否可以拥有多个属性关系、关系指称项间的实例重合度以及关系指称项和属性关系间存在的相似度等。同时,这些特征在关系映射时相互影响。为了将以上特征组织在一起,并建模它们之间的影响,本文提出了基于图算法的关系映射方法,该方法通过构造关系指称项-实例二部图,将属性关系作为标签赋给相对应的实体对和关系指称项,并通过图上的标签传播,从而实现联合多种特征的关系映射。在PATTY数据集上实验结果表明,相对于state-of-the-art方法,该方法取得了一定程度的性能提升,验证了该方法的有效性。  
其他文献
随着信息技术的不断发展,社会现代化、智能化程度随之日益提高,图像识别技术作为一门新兴技术因此得到广泛应用,进而图像识别方法的研究也成为广大专家、学者们追逐的研究热点。
随着电子技术的飞速发展,混合信号电路的集成度和功能复杂度不断提高,传统的物理探针方法已不能满足高密集成电路的测试要求,尤其是混合信号电路的广泛应用,对其有效测试提出了迫
手势识别作为实现人机交互的关键技术之一,是智能假肢、医疗康复、外骨骼机器人等研究领域中日益受到关注的一个研究方向。利用表面肌电信号(sEMG)准确提取手势特征信息并完成
纳米制造是纳米技术的核心内容之一,纳米制造能力直接反映了纳米技术的发展水平。纳米尺度的焊接加工是实现纳米制造的关键技术环节。本论文的研究内容以国家自然科学基金支持
在自动目标识别领域,通常使用模板匹配方法完成对目标的识别与跟踪,模板的好坏在很大程度上决定了自动目标识别算法的效果,工程应用中,对于建筑物目标,一般使用轮廓线作为模板。本
信息技术飞速发展,带动了工业控制领域的深刻变革,以智能仪表和现场总线技术为基础,逐渐形成了全分布网络集成化的现场总线系统。新一代的控制系统能给最终用户带来更多的便
视觉目标跟踪是计算机视觉领域中的研究热点之一。目标跟踪在智能监控、人机交互、虚拟现实等领域具有广阔的应用前景。经过几十年的研究,目标跟踪技术有了长足的发展,但是复杂
随着互联网业务发展的多样化,传统网络架构面临着前所未有的挑战。而构建全新的网络架构从经济、工程可行性方面考虑显得时机尚未成熟。在这种情况下,网络虚拟化技术被提出并
学位
目前最先进的卫星遥感成像已经接近0.1米的分辨率,然而卫星快速地扫描陆地和海洋时,会产生海量的图像数据,依靠人眼进行判读很难做到实时和无遗漏。因此,遥感图像目标自动检测方