论文部分内容阅读
中医学具有数千年的悠久历史,是我国优秀民族文化遗产中的一颗璀璨明珠,是研究人体生命活动过程以及抵御疾病、维护健康的科学,有自己的科学理论体系。而整体观念和辨证论治是其理论的精华所在,是在长期的经验积累中形成的理论体系,还没有一个独立的现在科学能完全解析,比如症状与证型、证型与治法、症状与方药、方药与方药之间有些是完全靠经验的积累形成的,而且传统的方法仅靠师传身授、手工收集和整理来继承不同名医的经验知识,其存在主观性强、可重复性差、效率低下等诸多不足之处。因此用数据挖掘技术从大量的中医治疗疾病的数据中挖掘隐含的中医经验成为可行且科学之法。本文以与肝相关内伤头痛的病历为数据样本,采用数据挖掘的一些算法,挖掘中医治疗头痛的相关经验,使经验科学化,本文在这方面做了一个初探。在论文研究期间,首先,到中医院临床收集了大量原始数据,并针对本文要使用的中医头痛的数据,对中医头痛进行了深入学习,然后深入研究了数据挖掘理论的主要算法,再根据要求对收集到的原始数据进行了删减与整理。本文以与肝相关内伤头痛的临床诊断病历为原始数据,研究了若干挖掘算法,并将其应用于与肝相关内伤头痛诊疗的挖掘。具体工作如下:(1)理论研究。深入研究了数据挖掘的相关概念,研读了最新的有关数据挖掘的研究成果,介绍了数据挖掘的分类、过程和方法,着重研究了关联规则和决策树算法。介绍了关联规则的定义、相关概念和分类,研究了经典的Apriori算法和FP—增长算法;介绍了决策树分类算法的概念和其生成原理,然后重点介绍了基于信息熵的决策树ID3算法,详细介绍了ID3算法的属性选择度量,算法描述等。(2)对原始样本数据的预处理。分析中医数据的特点,然后对中医数据进行规范和编码,并利用计算机来处理文本中医数据。(3)研究了经典的关联规则算法。建立起合理的挖掘模型,挖掘病历中“理—法—方—药”之间的关联规则。(4)分析了决策树算法的工作原理,并建立起中医症候分类的模型;研究基于信息熵的决策树分类方法在与肝相关内伤头痛辨证分类中的应用。实验结果显示,应用数据挖掘的相关算法能挖掘出符合中医辨证论治的规律,能较好的诠释中医治病经验的内涵和外延。