【摘 要】
:
生物医学的实体识别和关系抽取是从文本数据中识别特定的实体,并对实体间的关系进行判断。电子病历记录了病人详细的诊疗经过,对其进行命名实体识别,可以从中提取患病部位,发
论文部分内容阅读
生物医学的实体识别和关系抽取是从文本数据中识别特定的实体,并对实体间的关系进行判断。电子病历记录了病人详细的诊疗经过,对其进行命名实体识别,可以从中提取患病部位,发病症状,治疗药物等重要信息;再通过关系抽取判断实体之间的关系,可以用于更多医学应用,例如通过药物关系抽取可以预防多种药物同时使产生的不良药物反应等。因此研究生物医学命名实体识别和关系抽取对构建生物医学领域知识图谱,帮助医生进行病例研究分析,促进智慧医疗建设等有重要意义。命名实体识别可以分为实体类别识别和边界识别。相比英文电子病历的命名实体识别,中文电子病历的实体识别更加困难。由于中文词语之间没有间隔,在实体的边界识别上极易产生错误。针对这个问题,本文提出了结合实体先验知识和自注意力机制的实体识别方法,以Bi LSTM-CRF作为基础模型,将区分实体和非实体的词性标签作为模型的先验知识,对实体边界进行初步区分;再通过自注意力机制提高同个实体内的字符关联权重,进一步提升模型对实体边界的识别能力。本文在中文电子病历命名实体识别任务上进行实验,相比基准模型,F1值提高了12.75%,并且在实体边界识别问题上有明显的改进。药物关系提取是对药物之间的关系进行判断,药物关系抽取存在负样例较多,正样例较少,难以提取类别特征的问题。针对这个问题,本文提出了基于预训练BERT的药物关系抽取模型,结合类别先验知识和注意力机制,提高模型提取类别特征的能力。本文方法的主要创新点:(1)针对负样例较多的问题,本文提出了基于规则和模板的负样例过滤方法,将正负样本比例从原来的1:5.92降低为1:2.68。(2)为了提高不同类别样例的区分度,本文基于卡方检验和文档频率获取每个类别的关键词作为模型的先验知识,并在模型中通过关键词与药物对的位置编码来增加样例的差异性。(3)本文模型还通过注意力机制学习关键词与句子中其他词的分布信息,通过关键词与其他词的共现信息来提高模型分类效果。在公开药物相互关系DDI数据集上的实验结果表明,本文方法能够有效提高关系抽取效果,并取得了在该数据集上的SOTA结果。
其他文献
人类学批评既是当代人类学研究范式转型的重要标志,同时也是人类学展现其重构现实生活关系之能力的重要维度。人类学批评主要从"意识形态批评"和"日常生活批评"两个基本向度
新任副校长的职初适应是他们逐渐熟悉岗位并走向成熟的关键期,是一个从形式上任为副校长到能否真正意义上成为副校长的过程。无论从副校长个人成长还是整个校长队伍建设的角度看,这个过程都值得关注。长期以来,我国校长学研究主要关注正职校长,对副校长及其领导角色适应问题的研究较为欠缺,极个别的研究也多是强调副校长领导角色适应中的困难与挫折。基于此,本研究关注副校长领导角色适应问题,案例聚焦“成功”适应的经验。运
清人葛震《詩史》十二卷與曹荃《四言史徵》十二卷是既有密切關係又有明顯區別的兩部書,前者為原創,後者為補撰。《詩史》是一部以四言韻語為寫作形式、以歷代史事為吟詠内容
中粮地产收购香港上市公司大悦城地产是一起典型的住宅地产与商业地产结合案例,在房企融资困难、商品房销售额增速减缓的背景下,提升融资效率对房企至关重要。选取该案例的目的是研究收购对中粮地产融资效率的影响,并打开企业从筹资到实现效益过程的“黑箱”,即能否以低成本和风险筹集资金投入生产,生产出的产品是否能够为企业带来经营成果,将总融资过程分成资金筹集阶段和经营成果阶段分析融资效率变化的效果及原因,旨在为房
中医药是人类宝贵的财富,随着精准医学模式的提出,中医与西医领域的知识融合已成为必然趋势,以中医领域宏观概念为出发点与西医领域微观概念关联为主要目的的工作是基础并且十分重要的一环。当前,医学领域知识大都零散地分布在各类异构数据源当中,为全面系统的知识查询以及分析工作带来了较大的困难。此外,在中西医关联数据中,有些关系如疾病-症状、处方-中药、中药-化学成分之间的关系是确定的,而疾病-基因关系由于本身
随着我国市场经济的不断发展,我国金融行业发展速度加快,金融产品的种类增多,金融自由化程度加深。同时,因为我国金融行业与英美等国相比,金融市场的发展时间还较短,对金融市场的监管和研究程度有待提升。金融行业有着利润率高于实体行业的特点,使得各实体企业纷纷开始投资于金融市场,但同时金融也有着风险放大器的作用,其投资收益非常不稳定,所以对于金融的风险控制十分重要。另一方面,我国作为制造业大国,制造业是我国
由于铝合金具有密度小、比强度高等一系列优良特性,铝合金发动机的出现很好地应了汽车轻量化进程,既在生产过程中节约了原材料,又在实际应用消费中节省了燃油,降低了汽车尾气
近十年来,我国的影子银行发展迅速,成为金融市场上除银行信贷以外重要的社会融资途径,引起了国内外学者和监管部门的重视。我国目前的金融制度还不完善,对影子银行的理论和实
近年来,随着我国资本市场不断完善,许多上市公司都得以迅速发展,与此同时,企业也面临着巨大的竞争压力。压力面前,上市公司财务舞弊事件频频发生,引发了全社会的广泛关注。分析众多违法案例可知,这些企业的内部控制管理都存在严重的漏洞,也让人们意识到,规范企业内部控制行为,建立完善的内部控制体系对于上市公司是非常重要的。内部控制作为规范企业管理的重要举措,是实现公司治理现代化的关键环节。企业想要实现持续经营
在接触性作业中,机械臂末端微小的位置偏差就可以导致巨大的接触力,对机器人和目标物造成损坏,因此必须添加接触力的控制功能来提高机器人的有效作业精度。本课题以智昌川崎RS010N机器人为对象进行机械臂末端力/位置控制关键技术的研究,建立了机械臂末端力/位置模糊阻抗控制系统,以提高机械臂的柔顺性,增强系统对作业环境的适应能力,实现作业精度要求。本课题的研究工作如下:(1)建立智昌川崎RS010N机器人动