论文部分内容阅读
目的:圆锥角膜属于一类原因不明的疑难性角膜变性疾病,青少年时期发病,难于用普通屈光手段矫正,是导致青少年视力严重低下的常见病之一。利用角膜地形图,可筛查和早期诊断圆锥角膜,有助于及时采取适当的治疗,避免对圆锥角膜患者进行准分子激光角膜屈光手术;同时了解病变在角膜上的分布规律。可指导硬性角膜接触镜的验配。圆锥角膜的早期诊断有利于改善患者的视力,因而早期诊断成为一个越来越重要的研究课题。本文的目的就是用一种新的数学模型:即决策树分类方法来研究早期圆锥角膜患者的角膜地形图特性并用于圆锥角膜的辅助诊断,根据已有测试数据集评估该方法的特性,以便临床医师在诊断时更好的利用和理解角膜地形图。
方法:角膜地形图是圆锥角膜早期诊断的重要工具,角膜地形图仪早已在眼科临床中得到广泛的应用。本文在系统总结现有角膜地形图分析数学模型的基础上,引进计算机技术中处理大量数据的数据挖掘方法,提出了通过将TMS-4角膜地形图仪输出的属性作为决策树的分类依据产生用于辅助诊断的决策树。文章系统回顾了角膜地形图的原理,特征,圆锥角膜疾病的发生原理和特征,通过对试验数据去除噪声,清理空白数据,预处理和转换,建立目标数据集,构建数据分类器,选择决策树分类算法等步骤,最后通过WEKA数据挖掘平台实现的C4.5决策树分类算法,生成分类决策树。运用决策树的数学模型对角膜地形图进行分析,结合圆锥角膜的临床特点,得出一系列的判定规则,并将决策树用于试验数据集,将结果与其他角膜地形图分析方法做对比,论文还依据决策树提出了对圆锥角膜诊断有重要意义的角膜地形图参数,重要性排序及参考值。本文同时系统提出用于判定诊断方法优劣的规则,即综合考虑准确性,特异性,敏感性,临床可解释性(是否具有临床意义,在临床诊断中是否有可行性)和模式简洁度(在同样效果情况下,希望决策树小或规则少)和计算复杂度(方法实现时对时间和空间的复杂度)等标准来比较各种方法的优越性。
采用最近新版本的数据挖掘工具WEKA平台(Weka3.5.7,WaikatoHamilton,新西兰)下的决策树分类C4.5算法,针对采集的1350人2595眼(其中圆锥角膜患眼383,来自231患者)的角膜地形图数据的随机三分之二用作试验数据集构建决策树,另外三分之一的数据用作测试集评估决策树的判断准确率。构建决策树时采用的分类器由32组参数构成。其中前31组参数由角膜地形图输出所得,第32组属性由经过查阅病例后得到的最终诊断组成,即圆锥角膜患者与非圆锥角膜患者。
结果:将试验集数据产生的决策树作用于测试集,诊断准确率达到90.1%,特异性95.6%,并提示了在诊断过程中,Simkl值的重要性,其临界值为47.28,与临床上通过统计方法得到的“疑似”圆锥角膜的诊断标准一致。IAI,SRI等值也在圆锥角膜的早期诊断中有着较其他参数更高的权重,并给出了其临界参考值。
结论:决策树分类方法可以很好的用于角膜地形图分析,利用TMS-4输出参数作为分类器构建的决策树分类方法在圆锥角膜的早期诊断中特异性能高,计算简洁度低,临床可解释性强,更易临床医师的理解和操作。simKl,IAI,SRI值在圆锥角膜早期诊断中有着较其他参数更为重要的作用。使临床医师了解每组属性在圆锥角膜诊断中的临界值和作用。