【摘 要】
:
医学信息提取的第一步在于命名实体识别,然而公开医学语料的缺乏使得这项工作困难重重。已有的研究大都建立在少量人工标注的文本之上,不具备很好的推广性。互联网作为大量数
【机 构】
:
哈尔滨工业大学计算机科学与技术学院,哈尔滨工业大学基础与交叉科学研究院
【基金项目】
:
国家自然科学基金Nos.61472099,61772157,国家科技支撑计划No.2015BAH10F01
论文部分内容阅读
医学信息提取的第一步在于命名实体识别,然而公开医学语料的缺乏使得这项工作困难重重。已有的研究大都建立在少量人工标注的文本之上,不具备很好的推广性。互联网作为大量数据的聚集地,可以从中进行医学知识的提取。针对互联网资源规模大,结构化程度低,缺乏标注等特点,提出了一种迭代式框架来对其加以利用。使用融合通用模型和领域词典的方法对文本进行标注,缓解了领域不同带来的精度降低问题。使用在线方法来构建模型,避免了迭代中对模型进行整体重构。在命名实体识别模型中融入了词法特征、词缀特征、词长特征等,提高了模型的识别能力。提
其他文献
近些年来,随着经济的发展和人民生活水平的提高,我们的城市建设发展很快,城市面貌发生了很大变化。很重要的一个原因是各级政府领导特别关注城市建设,既有雄心,又有见地,修路
EAM的应用与实施在发电企业进行得如火如荼,但在供电企业却少有实施或应用.一方面是由于发电与供电的专业特点和市场环境有所不同;另一方面,如何本着以流程为本的思想,理清和
砂土是一种无凝聚力,抗压强度低的离散体,它具有非连续性、非线性。随机性等特征,这些特征给其位移场的计算和测试分析带来一定的困难,传统的教科书中大多将其视为连续体,按线弹性
本文从业主及建设方的角度出发提出在智能建筑工程实施时,智能化概念,工程实施步骤,技术发展状况等几个方面应注意的几个问题及作者的体会和经验。
患者,男,58岁,因贲门癌术后75天,呕血、黑便10天,量约100ml~400ml,于2003年6月17日收入院.查体:T36.4℃,P72次/min,R26次/min,Bp108/64mmHg;体重67kg,消瘦体质,自主体位,贫血
新型模板与脚手架技术是建设部九五期间重点推广应用的十项新技术之一。本文介绍了采用简易早拆模施工技术的连续支模作施工荷载传递分析及工程测试结果,并结合6幢高层建筑的工
旨在构建一种基于知识图谱Freebase的查询扩展模型,通过从Freebase中抽取与查询相关的若干实体及实体属性作为扩展词来重构查询,从而更好地表达用户的信息需求。在计算扩展词权
<正> 目前,许多屋架安装过程中,由于技术或安装误差等原因,容易引起偏心。但设计中常常不考虑由于偏心扭矩引起的杆件内力变化。实际上,如果屋架安全储备较小,而且偏心误差较
非结构网格应用软件编程框架JAUMIN(Jadaptiveunstructuredmeshapplicationsinfrastructure)支撑了多个千万亿次并行应用软件的快速研发,并已成功应用于重大科学装置结构力学分