基于信息熵的半监督领域实体关系抽取研究

来源 :山东大学学报(工学版) | 被引量 : 0次 | 上传用户:yhmlivefor51
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对监督机器学习方法抽取实体关系受限于标注语料的规模问题,提出采用信息熵方法来不断扩展小规模训练数据的半监督领域实体关系抽取。结合领域词汇选取小规模训练数据,构建了一定准确率的初始最大熵分类器,用来从未标记数据中预测出候选新实例。采用信息熵方法,通过设定不同熵值,多次循环以选取可信度较高的新实例来扩展训练数据。使用扩展后的训练数据重新迭代训练分类器,分类器性能趋于稳定迭代终止,实现了半监督学习的领域实体关系抽取。实验表明,和已有方法相比,本文提出的半监督领域实体关系抽取通过结合信息熵方法,在小规模标注样本环境中取得了较好的学习效果。 Aiming at the problem that the entity relationship of supervised machine learning method is restricted to the scale of annotation corpus, this paper proposes the extraction of entity relationship in the semi-supervised area by using information entropy method to expand the small-scale training data continuously. Combining domain words to select small-scale training data, an initial maximum entropy classifier with a certain accuracy rate is constructed to predict candidate new instances from unlabeled data. The information entropy method is adopted to expand training data by setting different entropy values ​​and multiple cycles to select a new instance with high credibility. Using the extended training data to iteratively train the classifier, the performance of the classifier tends to be stable and iteratively terminated, thus realizing the real-world relationship extraction of the semi-supervised learning. Experiments show that, compared with the existing methods, the proposed entity relationship extraction in the semi-supervised domain achieves good learning results in a small-scale annotation sample environment by combining the information entropy method.
其他文献
写故事讲究一个好的开头,这样容易抓住听众的心。课堂教学也是如此,有一个好的开头,才能吸引学生的注意力,激发学生的学习兴趣,使学生形成积极、自觉的学习状态。
光学天文望远镜拍摄下的某些星云图呈明亮的整体光团,目前公认的发光原因为星际尘埃或氢气在受到附近恒星光线照射下的反射或激发发光.星云与地球距离遥远,哪怕恒星也只能是
热力站供热系统已经实现了自动化控制,但是温度控制方面还有不足,导致供热中经常出现温度过高或者过低情况.这样不仅影响了供热质量,不能给用户带去良好供热体验,同时还存在
当前高中阶段生物教学与生活实践之间的有效融合措施,不仅能够促进学生对生物知识内容的及时性掌握,同时还能够加强学生对生物知识与生活实践之间关联性内容的不断分析和细致
本文研究了一类具有Holling-Ⅱ功能反应函数的三种群食物网模型,利用耗散性定理、极限集及Routh-Hurwitz判定等理论分析了系统的耗散性、边界平衡点的全局稳定性和物种的灭绝
本文从黑体辐射规律、狭义相对论和引力红移入手,设法完善万有引力公式,并构建科学的我们的宇宙模型,探究宇宙中最大黑洞的特征、暗物质暗能量的分布规律等.
目的:分析探讨精神科护理中采用人文关怀取得的效果.方法:研究活动于2018年2月至2019年3月展开,选择精神科接收患者82例.按照随机数表分组法将患者分为对照组与观察组,两组患
目的:探讨血清碱性磷酸酶(alkaline phosphatase,ALP)与原发性高血压并发冠心病的相关性.方法:本研究收集了2017年1月至2019年6月,在遵义医学院附属医院心血管内科住院,病历
前言rn鞋垫能有效改善鞋内环境和脚底受力状态,合适的鞋垫能使人们穿起来更舒服.随着生活水平的提高,人们对鞋垫提出了个性化、舒适性、医疗作用等要求,研究表明,鞋垫在治疗
期刊
本文分析了传统制样方法存在的问题和传统制样方法的局限性,概述了全自动制样系统,探究了在煤炭制备过程中全自动制样系统的优势,旨在提高煤炭制备过程的全自动化,促进企业自