基于深度学习的病人相似性度量工具的设计与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:nini8919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗卫生服务信息化进程的推进和医疗数据的积累,医疗人工智能已经成为了医疗领域内的研究热点。其中,通过病人门诊、住院、用药及健康等相关数据给出具有临床意义的病人间相似性度量,是在临床决策支持和病人群体识别研究中的一项重要技术。传统方法利用关键词检索、SQL查询等方式进行衡量,无法有效利用电子健康记录中潜在的大量医疗知识,而基于深度学习的病人相似性度量可以作为其补充。  本文研究病人相似性的度量问题。如何有效地从病人健康数据提取特征,如何对原始特征进行融合,如何获取病人相似性的监督信息,如何利用深度学习合理度量病人间的相似度,都是十分关键的技术问题。已有工作提出了有监督的距离度量学习及专家交互的反馈学习方法来解决上述问题,但在现实医疗场景中通常存在以下几点问题:(1)传统有监督的距离度量学习无法通过非线性变换从医疗语义层面对病人相似性进行刻画;(2)特定的疾病领域中病人样本的数量十分有限,无法有效利用传统度量学习方法得到病人的度量信息;(3)监督信息的获取十分困难,医疗领域的疾病种类繁多,在每个疾病领域中都利用专家来获取监督信息并不可行。  针对上述问题,本文对以下关键技术进行了研究:(1)设计了一种基于电子健康记录的病人特征画像模型,并给出静态特征、离散数值特征和连续数值特征的映射规则;(2)提出一种基于深度学习的病人相似度算法,算法将病人的诊断数据作为监督信息,利用深度学习强大的特征表示能力将病人映射到非线性的Embedding空间,并在此空间中优化目标函数从而更加准确地刻画病人之间的相似性;(3)提出了一种基于迁移学习的疾病领域间知识迁移算法,算法利用源疾病领域知识在目标疾病领域中选取合适的度量进而刻画其中病人间的相似性。  在上述关键技术的研究基础上,本文将病人相似性度量工具应用于病案检索系统,并对其进行设计与实现。本文利用多标签分类对相似度算法进行评估,实验表明相比原有算法,本文提出的深度学习算法准确率提升8‰迁移学习算法准确率提升12.3%,并且两类算法在稳定性方面均有较好的表现。
其他文献
非连续变形分析已被广泛应用于岩体稳定性分析、隧道修建、边坡开挖、爆破等多种工程领域。该方法严格遵守数学与力学原理,可模拟块体运动的大位移与大变形,是一种针对岩石非连
本文研究了如何借助于LEX和YACC两个工具,完成从C语言程序代码到目标代码的翻译工作,并设计实现了一个C语言的编译器。该编译器分为前端和后端两个部分,前端用语法制导翻译的方
石油在国民经济发展中的地位已毋庸赘述,但是我国石油的贮量形势令人堪忧。国内几个大型油田都不同程度地进入了衰竭期,很多油井因“出不敷入”已关闭,大量的低产油井也因功耗大
该系统是一个基于B/S模式的通用型考试系统,其目的是提高教学管理效率和资源共享程度.系统主要包括题卷管理、在线考试、成绩管理、综合评估等功能.该系统采用B/S结构,即采用
工作流管理系统帮助企业将其业务活动分解由多个任务组成的一个工作流,并按照一定的规则,在一个分布式的应用环境中对它们进行执行与监控,同时企业的工作人员也被配以一定的
在电子商务迅猛发展的今天,商业社会的各部门需要信息共享与交换。一开始,人们试图通过各种不同的方式来交换信息,如文本文件、FTP等,但一直以来都没有一个标准的途径,直到可扩展
随着并行处理技术的不断发展,机群系统因其良好的性价比、卓越的可扩展性与可用性,逐渐成为当前高性能计算机领域的主流结构。在机群系统中,机间通信的性能是影响整个系统性
ARTs-OS的中断管理模型是在对各种实时系统实现技术的评估和系统的具体需求的分析基础上建立的.ARTs-OS的中断模型包括了中断模拟、中断的优先级调度、中断屏蔽、核外中断等
该文从理论和实践两个方面,对面向对象的中间件技术进行研究.论文首先从系统建模的角度论述了面向对象的重要概念和通用建模语言(UML),然后研究了三种主流的面向对象中间件技
学位