生物医学文本中抗生素耐药性信息抽取方法研究

来源 :华中师范大学 | 被引量 : 1次 | 上传用户:lwfriendly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抗生素耐药形势严峻,抗生素发展遇到了前所未有的挑战。了解抗生素耐药作用机制对于有效跟踪耐药性传播、优化治疗方法以及进行新药物研发至关重要。大量关于抗生素耐药性研究成果存在于生物医学文献中,使用文本挖掘相关方法自动从文本中获取信息有效降低了知识获取成本并提高了工作效率。本文将抗生素耐药性信息抽取建模为生物医学事件抽取任务,以期从生物医学文本中自动获取抗生素耐药作用机制信息。生物医学事件抽取主要由生物医学触发词识别和元素检测两个子任务组成。其中,生物医学触发词识别是生物医学事件抽取任务的前提,是本文的研究重点。现实中存在一些生物医学知识库,如何有效对知识进行再利用也具有一定研究意义。针对抗生素耐药性信息抽取研究,本文分别进行了触发词识别任务和元素检测任务。本文主要工作和贡献如下:(1)标注了抗生素耐药性数据集(ABEE)。本文将抗生素耐药性信息抽取建模为生物医学事件抽取任务并标注了抗生素耐药作用机制数据集。本文按照CARD分类标准,下载并人工标注了 1960篇关于细菌与抗生素耐药性研究的医学文献摘要。(2)提出了基于Few-Shot Learning的抗生素耐药性触发词识别框架。普通基于深度学习模型的性能对训练数据集规模依赖性较高,而大规模的训练数据集通常不易获得。因此,本文从特定领域训练语料稀缺的角度出发,将生物医学事件触发词识别任务建模为小样本学习问题,提出了一个基于Few-Shot Learning的抗生素耐药性触发词识别框架,并提出利用自注意力机制对外部知识进行了有效融合。(3)提出了基于Bi-LSTM+CRF抗生素耐药性元素检测框架。生物医学事件抽取主要包含生物医学触发词识别和元素检测两个子任务,为了完善整个生物医学事件抽取流程,本文采用了基于双向长短期记忆网络以及条件随机场的深度学习框架进行生物医学事件元素检测任务。本文提出了将细菌与抗生素耐药作用机制信息抽取建模为生物医学事件抽取任务的方法,并基于真实数据进行了实验,实验结果证明了方法的有效性。生物医学事件抽取可以自动识别出分布于生物医学文本中的抗生素耐药事件,为后续的抗生素耐药性研究提供了一定的研究基础。
其他文献
“互联网+教育”背景下教育与信息技术的不断融合,为在线教育的迅速发展奠定了基础。在线教育也因其跨越时间、空间的优势受到越来越多人的关注,新冠疫情的爆发更是加速推动了在线教育的发展。与传统教育相比,在线教育的教师无法实时监督学生的学习状态,师生之间缺少必要的交互与情感交流,导致学习效果无法得到保证。因此,开展在线学习状态识别研究对于完善在线教学系统的监督手段、提高教学质量具有积极的社会价值。论文提出
学位
近些年来,随着数据量的快速迭代和爆发式增长,人们对数据的智能化处理要求越来越高,原有的算法和技术框架已经远不能满足人们日益增长的需求,人们急需一种新的数据处理范式,在这样的背景下基于神经网络的人工智能技术应运而生。现如今,人工智能技术正在以各种方式影响着人类生活的方方面面。文本生成作为人工智领域最具挑战性的研究课题之一,在自然语言处理领域占重要的地位。文本生成虽然具有很长的研究历史,但是大多为开放
学位
随着在线会议以及远程课堂的蓬勃发展,在线教育逐渐出现在了人们的视野中。传统教育中所有工作都基于教师和学生线下互动,教师随时都可能需要对学生进行干预,这对教师的工作效率有一定的影响。而在线教育平台则可以满足师生们的这些需求,例如在线练习与考试可以帮助教师节省批改时间,减少信息传达失误,也可以让学生在老师不在身边时能进行自主学习。但目前在线练习系统中的个性化内容主要是基于学生行为或是题目本身进行推荐,
学位
近年来,随着生活水平的提高以及饮食习惯的改变,糖尿病发病率逐年增加,并已成为对人们身体健康产生广泛影响的的一种慢性疾病。糖尿病视网膜病变是糖尿病一种极为常见并严重的并发症,已成为我国成年人失明的主要原因之一。因此,及时的诊断和治疗可以有效地避免对人们视力的危害。当前,筛查糖尿病视网膜病变主要通过眼科医生人工检查患者的眼底图像,但是由于眼底图像复杂、人工检查时间较长、效率低下、使得很多患者不能得到及
学位
作为学生学习生活的重要场所,教室的空气质量指数(Air Quality Index,AQI)直接影响学生的身体健康与学习效率,教室AQI的监管与评价尤为重要。现有的室内空气质量智能监管系统存在检测指标较少、实时监控缺乏以及评价方法不完善等问题。因此,利用物联网(Internetof Things,IoT)和Java Web等技术,设计一种教室AQI监管与模糊评价系统,对教室AQI进行合理的监管与评
学位
在大数据时代,个性化自主学习的呼声日益高涨,微课教学应时而生。微课以微视频为载体,精简了教学时间,具有较强的教学针对性,具备可重复观看及便于资源共享等特点,成为当今教育的热点。立体几何是高中数学教学中非常重要的知识板块,可以培养数学直观、逻辑推理、数学运算等学科素养。微课辅助立体几何教学,创新了教学形式,贯彻了学生为主体地位的教育理念,有着巨大的实际意义。基于此背景,笔者对立体几何的微课教学应用进
学位
近年来,教育大数据背景下教育领域信息化、网络化的推进,使得教育数据资源快速积累,随着教育信息化建设进入到应用的阶段,更多人工智能技术的兴起,激发了教育数据资源应用的深度挖掘与探索,也给需要借助传统统计学处理资源的众多学科新的解决思路,同时也将研究人员从处理与甄别工作中解放出来,专注于问题的研究与分析。目前教育信息化评估领域数据资源的采集处理与应用在不断地丰富完善,更多的算法应用到中小学评估资源的处
学位
近年来,随着互联网的快速发展,人们已经进入了大数据时代,各种信息数据都在实现着爆炸式的指数型增长,数据信息量处于过载状态。个性化推荐系统作为解决信息过载问题的有效手段,现已经广泛地应用到如电商平台,电影推荐,音乐推荐等各个领域当中,对于推荐算法的不断优化和改进,不仅能够提高用户体验,还能带来一定的商业价值,推动其他行业的发展。在推荐系统中推荐算法是最为关键的部分,良好的推荐算法能快速且较为准确的预
学位
大脑是生物体的“领导中心”,支配着身体的各项活动。大脑接收并处理复杂信息的原因是神经元网络之间的连通与协调的电活动。为了掌握大脑处理信息并发送指令的过程,需要高分辨率技术来监测神经元的电活动。测量神经元电活动的传统方法有:电压钳技术、电流钳技术和膜片钳技术,具体方法是用玻璃毛细管拉制成电极,穿透细胞膜获得神经元电生理特性,理解其动作电位的机制。大脑中的神经元有上千亿,用以上传统方法的缺点是同时监测
学位
互联网的快速发展在给人们带来便利的同时,也给人们的生活带来诸多安全隐患,其中信息安全尤为重要。为提高传输信息的安全性,保护个人隐私,很多学者在从事隐写技术研究,它是利用载体的冗余,将秘密信息嵌入到载体中通过公共信道进行传输,避免第三方的怀疑,从而实现秘密信息的传递。图像是隐写常用的载体之一,传统的以图像为载体的隐写术都是以单张图像作为载体,但单张图像作为载体隐写容量有限。为适应实际需求,确保秘密信
学位