面向知识图谱补全的知识表示学习算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:get_to_do
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱包含结构化的知识,是很多人工智能应用的基石。为了扩大知识图谱的规模,知识图谱补全任务逐渐受到了重视。而知识表示学习算法则是知识图谱补全任务最好方案之一,这类算法不仅拥有较强的泛化能力,还具有较好的扩展性。然而,经过深入的分析和研究,我们发现现有的知识表示学习算法还存在不少缺点,并从三个角度对它们进行了改进:1)面向新实体的动态知识图谱补全任务能同时扩大知识图谱的实体集和三元组集,具有较好的现实意义,然而,现有的知识表示学习算法无法很好地处理这个任务。本文根据该任务的本质针对性地提出一个新颖的知识表示学习算法,除了利用神经网络对描述信息进行建模外,我们还设计了两种用于构建实体结构向量的编码器。其中,实体最终的向量来源于文本向量和结构向量的组合。2)大部分知识表示学习算法需要在训练过程中随机生成负样本,而负样本的质量会严重影响算法的泛化能力。因此,本文通过充足的实验分析了现有负样本生成策略的优缺点以及稳定性。此外,我们还设计了两种新颖的负样本生成策略。3)知识表示学习算法能通过端到端的训练方式得到实体的向量,这些向量其实是一种高阶非线性特征。基于这个思路,本文提出了一套新颖的基于知识表示学习算法的数据预测框架。其中,由于数据预测任务的目标通常是比较单一的,与面向全局的知识表示学习算法存在鸿沟,因此我们提出了两种基于目标关系的局部知识表示学习算法。我们针对以上三个角度分别做了实验,并与相应的基线算法进行了比较。实验结果表明本文提出的算法在静态以及动态知识图谱补全上都取得了较好的结果,这说明实体和关系的语义得到了更好的刻画。此外,本文提出的负样本生成策略在HITS@10上优于现有策略,与此同时,我们还发现不同策略结果的稳定性主要受到数据集的影响。而本文提出的数据预测框架则要优于大部分基线算法,这说明从知识表示学习算法角度去做数据预测任务是一种可行的方案。
其他文献
7月29日,云南昆明地区各界回族同胞欢聚一堂,隆重庆祝一年一度的开斋节。省委常委、省委统战部部长黄毅,副省长尹建业出席庆祝活动。受黄毅部长、尹建业副省长委托,省民委主任赵
胃肠道疾病是儿科常见病之一,呕吐是常见的症状,胃复安具有较强的止吐作用和增强消化功能.因而被基层广泛应用于临床。但儿童剂量往往不容易掌握,故经常出现用药剂量过大、或反复
总结80例心肌梗死(MI)卧床病人便秘的护理分析原因,采取心理护理、饮食护理、应用药物等措施,临床效果满意。现报告如下。
在临床使用的中成药中,有一部分是含有化学药的中西药复方制剂。在使用含有西药成分的中成药时,因很多人缺少专业经验,不了解药物成分,将其当做纯中药制剂,这可能会造成很多
胰腺囊肿在我国较为常见,我院外科自1970~1999年共收治胰腺囊肿24例,其中20例采用了内引流术,现报告如下。
消化性溃疡指胃、十二指肠溃疡,是一种常见病、多发病。具有病程长,节律性上腹疼痛,易复发等特点。并有严重的并发症如出血、穿孔、幽门梗阻及癌变。故较严重的溃疡需住院治疗,但
这些年在云南各地游走,多数时间在荒野大山中转悠,见识过诸多不俗的风景,吃过不少叫不上名字的美味,但无论河岳山川、风物田舍、舌尖美味,再怎么壮丽的风景,当时再如何打动人心,都随
平望位于京杭古运河和现代运河的交汇处,历来是大运河上的重要城镇和水路交通枢纽。这里汉通运河,晋凿荻塘,唐设驿站,北宋设置军塞。宋元年间平望运河两岸已“邸肆间列,以便行旅”
中国城市交通道路路口主要为平面交叉的形式,侧面碰撞事故发生起数占总事故数的41.81%,且侧面碰撞工况下乘员的死伤率是所有工况中最高的,儿童乘员的死伤率也是最高的。全球
近年来,随着生态环境重要地位的凸显,生态环境治理进入了新阶段,人民群众对于生态环境治理保护提出了新要求新期待。经济的流动性和生态系统的循环性,使得生态环境问题突破行政区界限制,成为跨区域生态环境问题。跨区域生态环境问题影响范围广、影响领域多、影响程度深、影响人数多,势必造成严重的后果,跨区域生态环境治理保护问题的重要性及其紧迫性日益突出。针对跨区域生态环境问题,习近平继承丰富和发展马克思主义生态文