【摘 要】
:
远监督学习是适合大数据下关系抽取任务的一种学习算法.它通过对齐知识库中的关系实例和文本集中的自然语句,为学习算法提供大规模样本数据.利用本体进行关系实例的自动扩充,
【机 构】
:
吉林大学计算机科学与技术学院,符号计算与知识工程教育部重点实验室吉林大学,吉林大学国家地球物理探测仪器工程技术研究中心
论文部分内容阅读
远监督学习是适合大数据下关系抽取任务的一种学习算法.它通过对齐知识库中的关系实例和文本集中的自然语句,为学习算法提供大规模样本数据.利用本体进行关系实例的自动扩充,用于解决基于远监督学习的关系抽取任务中部分待抽取关系的实例匮乏问题.该方法首先通过定义关系覆盖率和公理容积率,来寻找与关系抽取任务关联性大的本体;然后,借助本体推理中的实例查询增加待抽取关系下的关系实例;最后,通过对齐新增关系实例和文本集中的自然语句,达到扩充样本的效果.实验结果表明:基于本体的远监督学习样本扩充方法能够有效完成样本匮乏的关系抽取任务,进一步提升远监督学习方法在大数据环境下的关系抽取能力.
其他文献
目的 探讨经阴道二维及彩色多普勒超声并配合宫腔注水声学造影诊断子宫内膜病变的价值。方法 回顾性分析 5 6例经手术病理证实的子宫内膜疾病的经阴道彩超声像图特征。结果
目的探讨延续性护理在先天性巨结肠(HD)患儿术后的应用价值及对通便的影响。方法选择2013年6月至2017年6月我院收治的先天性巨结肠患儿70例,随机等分为对照组和观察组。对照组
讨论我国药用植物资源调查方法存在的问题,阐述3S技术应用于药用植物资源调查的思路和方法,列举一些3S技术在药用植物调查中应用的实例,并对3S技术在学生野外资源调查中的应
目的探讨急性有机磷中毒(AOPP)中间综合征(IMS)的诊断治疗。方法对16例IMS的临床表现、血清胆碱酯酶(ChE)活力、病程等进行分析,并观察药物及呼吸机治疗的疗效和转归。结果IM
静态复杂网络研究在揭示社会网络、信息网络和生物网络的形成和演化机制方面取得了重要成果,其方法和结果对系统生物学产生了重要影响.但现实世界中,很多网络是随时间发生变
ODR作为一种新兴纠纷解决方式,首先是在以美国为代表的西方国家兴起。文章首先对国外的ODR进行了考察,并对一些共识性的结论加以归纳。随后,以我国目前仅有的两个ODR网站为对
目的观察健脾化痰方联合行为干预方法治疗痰浊型阻塞性睡眠呼吸暂停低通气综合征的临床疗效。方法以痰浊型阻塞性睡眠呼吸暂停低通气综合征患者为研究对象,按照随机数字表法
本文简述了国际国内主要标准化组织负责的电能质量标准化情况,提出了在智能电网、分布式能源等环境条件下,我国电能质量标准体系的构建原则和标准体系框架,最后给出了我国电
目前,对变压器绕组温度的测量主要是通过热模拟测量方法,绕组温度表在油温表的基础上配备一台电流匹配器和电热元件,通过温度叠加来反映变压器绕组温度。这种测温方法具有简
随着现代化生产和国际贸易的发展,现代科技高速发展带来的物质世界的极大满足导致了人们精神需求的多样化。包装已逐步成为产品销售策略中的一大支柱产业,成为一门综合性学科