医案语料库的构建及其“内生五邪”病证数据挖掘

来源 :上海中医药大学 | 被引量 : 0次 | 上传用户:guohiahong9999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医医案文献浩如烟海,这些医案文献作为中医药理论与经验的载体,贯穿并指导着临床实践,其学术价值和实用价值经久不衰。对医案开发和利用是必不可少的工作。从自然语言处理的角度来研究医案,并采用数据挖掘技术来发现语料库中所蕴含的病证信息,是中医文献与诊断学研究的新方向。 本课题的研究目的有二: 其一:构建医案语料库的目的是为了建立适合医案分析的统计语言学模型做语言加工准备,来提高计算机程序解读中医医案中相关词汇和语义的能力,为后期的数据挖掘奠定基础。 其二:选择医案语料库中的“内生五邪”病机所引发的病证(本文简称“内生五邪”病证),作为数据挖掘的研究实例,通过随机森林、贝叶斯网络等数据挖掘方法,发现潜在的“内生五邪”病证知识,冀希望达到对中医基础理论中的“内生五邪”理论进行丰富和补充的目的。 本文主要内容如下: 由于机器学习和古籍文献数字化的需要,本文提出的方法和实验都基于语料库的数据驱动进行。医案语料库建设工作主要包括:多层次医案语料库的提出和构建,语料库加工规范的制定。在基于领域本体的语义分类框架的基础上,对医案语料进行深层次的语义加工。该方面工作是整个课题的研究基础,具有重要的意义。 在构建医案语料库的基础上,文章的后部分重点是对语料库中“内生五邪”病证进行辨证数据挖掘。主要采用随机森林和贝叶斯网络这两种数据挖掘方法对五邪病证的主要临床表现进行重点分析,找出其病证规律。其中,基于随机森林的机器学习方法主要对“内生五邪”病证的特征症状选择进行研究。而基于贝叶斯网络的模型主要对“内生五邪”病证的分类识别进行研究。通过上述两种不同的挖掘方法,对医案语料库中“内生五邪”病证的辨证知识进行了客观分析,从而对疾病过程中所产生得类似于风、寒、湿浊、火、瘀血、痰等病理状态进行了深入细致的客观化研究。
其他文献
土壤中一般都含有大量的铁,但由于土壤性质和条件不同,有些土壤对植物有效铁却往往不足,不能满足作物需要,因而产生缺铁症状。我们发现在徐州地区西部的石灰性土壤上,洋槐、
目的:分析砂仁促进胃术后胃肠功能恢复的临床效果.方法:将我院2017年12月至2019年12月收治的80例胃术后患者纳入至本次研究,依照数字随机表法将其分为对照组(40例)与观察组(4
目的:本研究选用王乐亭十二透穴,采用穴位透刺法治疗卒中后肩手综合征患者30例,并与普通针刺组对照,通过比较治疗前后两组患者 VAS评分和 Fugl-Meyer上肢运动功能评分,观察本疗法
目的:探索冠心病心肌缺血与心律失常病患者采用动态心电图检查的效果及临床医学价值.方法:选择我院2018年10月-2019年5月来本院心血管内科接受治疗的100例病患者作为本次研究
目的:观察氨氯地平与卡托普利联合应用于冠心病合并高血压患者治疗的临床疗效.方法:抽取我院2017年2月~2019年2月期间收治的冠心病合并高血压患者84例,并根据随机数字的方法将
目的:检测艾条温和灸穴位重复熏灼和CO2激光灸穴位重复照射时受试者耐受时间和耐受温度,比较两者的耐受时间和耐受温度变化曲线,为艾条温和灸临床规范化操作提供实验数据,同
学位
目的:研究唯阴康联合复方莪术油栓用于治疗合并有宫颈糜烂的阴道炎的临床效果.方法:将48例合并有宫颈糜烂的阴道炎患者随机分为两组,实验组(24例)和对比组(24例).对比组采用
目的:探讨联用硝苯地平、酚妥拉明与硫酸镁治疗妊娠高血压的效果.方法:临床实验对象为确诊妊娠期高血压患者,对象资料总计90份;按抽签法随机分成两组后,分别采用不同用药方案
目的:探讨丁苯酞注射液在基底节区脑梗死患者中早期使用的临床效果.方法:选取研究特定时段 (2017.8-2019.7)内我院收治的 120 例基底节区脑梗死患者为临床对象,按照研究对比
目的:观察并探讨牙体牙髓病临床教学中应用翻转课堂联合CBL教学方法 的效果.方法:选取2017年-2018年期间我院牙体牙髓病科84名规培生作为研究对象,随机学生分为对照组与实验