基于半监督协同训练的百科知识库实体对齐

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:yaoyao1021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统实体对齐方法中的有监督学习算法依赖大量标注数据,以及特征表示不适用于百科知识库等问题,提出一种基于半监督协同训练的实体对齐方法。将实体对齐建模为一个带约束的二分类问题,充分利用实体名、属性、描述文本及其中的时间、数值等关键信息,组合生成多维特征;将特征划分为2个相对独立的视图,通过2个视图上分类器的协同训练,迭代地从未标注数据中学习同义实体的分布情况。在2个中文百科上的实验结果表明,使用半监督协同训练方法进行实体对齐的F1值达到84.3%,较其他方法效果最优,证明了其有效性和在百科知识库上的实用价
其他文献
<正> 1.草甘膦 草甘膦是有机磷类除草剂,剂型有10%水剂和40%草甘膦铵盐水剂。毒性极低,对人畜高度安全,耐贮藏。本药腐蚀性很强,用后注意清洗药具。只能通过喷洒植物茎叶起到杀
目的 评价分子靶向药物索拉非尼治疗肝细胞肝癌患者的临床疗效及安全性.方法 采用索拉非尼治疗肝细胞癌患者19例,观察其临床疗效及不良反应情况.结果 除1例患者因用药2周内出
交叉熵算法是目前逐步优化而形成的的一种计算方法,在解决多种优化组合的问题上具有较好的性能。在基于信道均方误差的准则下,本文基于交叉熵算法,提出一种适用于非连续正交
长期以来,在应试教育的束缚下,学生思维空间狭隘,思维的触角只停留在生活的表象而未深入复杂的深层。在小学生作文中,有许多作文题目是常见的,如《一件难忘的事》、《我最喜欢的一
【正】 一、实现肉羊良种化,充分利用杂种优势 良种是提高生产水平的基础,失去这一基础,再好的饲养管理都会失去作用。我国当前饲养的肉羊多数生长速度慢,产肉力和胴体重偏低
介绍在网格管理环境中如何使用智能代理进行合作。给出在智能代理之间进行配置,针对不同的层次架构所使用的规则,介绍如何从规则中自动推出并大致获取生成通信信息。本文对3
针对在线多目标跟踪中的短时遮挡和检测器误差造成的误检和漏检问题,提出一种结合参数学习和运动预测的在线多目标跟踪算法。采用逐帧关联的方式,首先利用目标的历史轨迹建立卡尔曼滤波器模型预测目标当前帧的可能位置,然后计算目标和当前观测之间的关联度建立代价矩阵。对于多目标跟踪被建模为指派问题,采用Hungarain算法求解,此外制定策略处理目标出现、消失和遮挡等异常情况。而对于多目标跟踪系统中的参数,设计一
《煤矿安全规程》的严重问题包括:未规定在采煤工作面、掘进工作面安装测试瓦斯突出的传感器,不能在发生瓦斯突出的瞬间探测到瓦斯突出;规定的复电条件在瓦斯突出结束后复电,可产
《语文课程标准》明确要求:学生是语文学习的主人,教师只是学生学习的促进者。在中学语文创新教学中,让每个学生切实成为学习的主人,养成自主学习的习惯,这对学生的成长和学生未来
<正> 1996年在阳城县寺头乡北树村100亩桑园中推广了中晚秋蚕期桑树水平剪梢留叶技术,结果不但中晚秋蚕单产增加,而且比上年增养蚕30张。 一、准备工作 1.加强管理,促进桑树