基于深度学习的中医智能处方模型研究

来源 :天津中医药大学 | 被引量 : 0次 | 上传用户:xiaojiaoechou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的迅速发展,深度学习在医学领域的应用越来越广泛,甚至改变了部分研究的发展局面,在此背景下,国家提出推进中医现代化、信息化、智能化的目标。虽然目前已有一些人工智能和中医结合的应用研究,但对中医智能处方模型的研究非常少,仅有的一项研究最终效果不理想。然而智能处方模型研究是中医智能化目标中非常重要的任务,因此,本研究针对中医智能处方模型的构建、多种处方模型的效果比较、模型语义特征提取及中医古籍证治规律的可视化分析这三方面内容做了重要的探索工作。已有的中医智能处方模型研究中,因缺少模型预训练方案以及训练数据庞杂,导致效果不佳。本研究批判的继承了上述研究的优劣,并且结合中医理论特点,确立研究方向为:采用迁移学习策略、使用语言预训练模型及深度学习模型、使用中医领域公认的经典内容作为训练数据。因此,本研究最终开展了以下工作:(1)依据中医基础理论选择了《伤寒论》、《金匮要略》作为基础数据集,《注解伤寒论》、《金匮要略浅注》、《订正仲景全书金匮要略注》作为补充数据集,《黄帝内经素问》、《灵枢经》、《难经》作为微调数据集。其中针对基础数据集进行EDA数据增强处理。(2)预训练策略选择基于四库全书的词嵌入模型、基于中文维基百科的BERT模型、以及基于中文维基百科和通用数据库的Ro BERTa模型。同时,通过微调数据集对BERT模型进行微调预训练,成为TCM-BERT模型。(3)基于预训练策略构造多个深度学习智能处方模型,并针对基础数据集和补充数据集进行多次实验比较,最终得出Ro BERTa-large分类模型为最佳处方模型,其评估结果为:基础数据集测试集精确率92.22%,召回率86.71%,F1值89.38%,十折交叉验证精确率94.5±2.5%,召回率90.47±4.1%,F1值92.38±2.8%。补充数据集测试集精确率80.82%,召回率71.50%,F1值75.87%,十折交叉验证精确率81.85±4.4%,召回率71.28±3.2%,F1值76.14±3.1%。(4)基于训练好的Ro BERTa-large模型对《伤寒论》部分典型条文进行语义特征提取和可视化分析,并探索其中规律。结果发现,模型并非单纯记忆其中的症状组合,而是将其按照不同含义进行智能分层处理,每层内部规律为重要症状之间的关联、病证与症状之间的关联、条文中的标点间隔,层与层之间的规律为递进关系或动态症状转变。因此,基于深度学习语义特征提取的分层分析方法可以进一步深入剖析《伤寒论》。本研究虽然对中医智能处方模型的构建做了重要的探索工作,但是仍存在不足之处。未来的研究方向应该着重将中医知识图谱与BERT系列预训练模型结合,可以为模型带来更好的效果。此外,应进一步将基于深度学习的语义特征提取和可视化分析方法用于中医古籍的探索研究中。
其他文献
人体行为识别是计算机视觉领域的重要研究课题,在医疗监护、智能家居、虚拟现实、人机交互、智能安防、基于内容的视频检索、运动员辅助训练等领域具有非常广阔的应用前景。传统的人体行为识别方法通常不考虑视角变化的影响,它假设在训练和测试期间视角是相同的。而在实际情况中,视角通常都是变化的。当视角变化过大时,这些方法的识别准确率将显著降低。本文主要研究跨视角人体行为识别问题,在该问题中模型的训练和测试是在不同
进入新常态以来,中国在经济发展的过程中更加注重质量。然而,体制机制不健全在一定程度上制约了宏观经济发展质量提升和微观企业主体经营绩效改善。在制约宏观经济发展质量和微观企业主体经营绩效的机制中,公平竞争机制不健全是其中重要的一方面,缺乏健全的公平竞争机制,将使得市场竞争难以有效进行,整个市场效率相对较低,企业绩效难以得到有效提升。近年来,为推进经济结构转型升级和经济发展动能转换,国家持续推动市场化机
加入世贸组织以来,中国对外贸易发展迅速,逐渐成为货物贸易世界第一大国。与此同时,一方面巨大的能源消费为经济和贸易发展提供动力支持,另一方面,能源供需矛盾,不合理的能源消费结构,低水平的能源利用效率等能源问题又反过来成为制约经济和贸易进一步发展的主要因素。因此,研究对外贸易开放对能源消费增长的影响机制具有理论和实际意义。本文选用2006-2015期间中国285个地级及以上城市数据,运用分解分析方法将
随着中国互联网行业的快速崛起,出于对便捷生活的需求,各种智能化设备获得了空前发展,与此同时也导致无线通信所依赖的频带出现了资源紧张的问题。由于互联网应用的多样化,对现有的通信速率提出了新的挑战。截止到2019年全国大部分地区都开始了第五代移动通信(5th-Generation,5G)的商用测试,但是5G只能解决当前通信遇到的部分难题,仍需通过下一代通信技术的不断研究寻找通信发展的新方向,这对未来的
随着生活水平的提高,城市汽车购买量越来越多,堵车和空气污染在现代都市生活已是司空见惯,这就迫切的要求我们采用更加高效环保的交通工具,双轮自平衡车具有轻便灵活,速度快,环保节能的优点,而且它也很好的解决了人们的近距离出行问题,同时也具有很高的娱乐性,在生活中越来越受到人们的青睐。但是目前市场上的的双轮自平衡车应用还有一定的局限性,首先它对道路环境的要求较高,在一些复杂路况的道路环境中,还不能看见它的
随着遥感技术的快速发展,各类遥感卫星传回的遥感图像分辨率越来越高。因遥感图像携带信息越来越多,故从遥感图像中识别典型目标成为可能。其中,机场区域作为重要的大型人造目标,对其识别一直是遥感图像识别领域重要的研究方向之一。机场区域面积较大,因其独特的功能,使得机场区域远离城市中心。为了准确从大场景遥感图像中识别机场区域,本文以遥感图像预处理方法为基础,依据机场区域纹理特征,采用改进最大类间方差法对遥感
近年来,随着人造卫星的发射,遥感技术开始应用于气象观测,地理测绘,城市规划,资源环境监测等多个领域。通过遥感技术,人们可以解译遥感图像从而获取图像中的信息加以利用。但是由于受地理环境影响,太阳光线在传播过程中被山川树木或者城市中的高大建筑物等地物遮挡从而形成阴影。阴影的存在有利有弊,一方面,我们可以利用阴影对城市中建筑物进行估算高度或者形状等操作;另一方面,阴影的存在会导致遥感图像中阴影区域的信息
对于科研工作者而言,专业领域文献是他们在日常学术研究过程中使用最多、最频繁的资料。在科研大数据时代,面对亿量级的文献资源,科研工作者很容易陷入海量文献的泥潭中。知识图谱作为知识经济下的新兴技术,可以从语义角度结构化地描述文本中的实体以及实体之间的关联。因此,将知识图谱应用至科研学术领域,构建专业领域文献知识图谱,描述知识骨干网络,这对科研工作者具有很大的价值。本文设计了专业领域文献知识图谱的整体构
高校图书馆是学校的文献信息资源中心,是为人才培养和科学研究提供服务的学术性机构,是高校文化建设和信息化建设的重要阵地。当前,在把思想政治工作贯穿教育教学全过程,实现全员、全过程和全方位育人的背景下,深入地挖掘高校图书馆所蕴含的思想政治教育资源,主动地发挥和释放其思想政治教育功能,对于构建“大思政”育人格局,提升高校思想政治工作的针对性和实效性具有重要的意义。高校图书馆是图书馆的重要类型之一,不仅具
在土地变化领域,土地变化及其驱动因素的作用过程具有明显的尺度相关性,某一尺度上揭示的土地利用变化驱动力在其他尺度可能并不产生作用,对土地利用变化空间多尺度驱动力的作用规律及机理进行研究,有助于理解土地利用格局变化的过程和机制,从而更加准确地把握区域土地利用变化规律,以实现土地资源的合理、可持续利用。本文选取滇中城市群、昆明市和嵩明县组成上下贯通的三级研究区,以2009年和2015年的1:10000