论文部分内容阅读
据《2019中国卫生健康统计年鉴》,我国城乡居民冠心病患病率和死亡率一直处于上升状态。2018年我国城市居民冠心病死亡率为120.18/10万,农村居民为128.24/10万。对冠心病进行早期诊断可有效防止病情恶化、降低病死率。冠心病的诊断可分为识别与分型两步。基于此研究背景,针对目前冠心病自动识别与分型算法中人工设计特征泛化能力差和训练数据需求量大的问题,本文构建了基于深度森林的冠心病自动识别模型,自动提取有效特征,并用少量训练数据获取最优模型。在实现冠心病有效识别的基础上,鉴于冠心病各分型的治疗手段不同,提出了基于加权平均深度森林的冠心病智能分型算法,通过改进深度森林的特征融合方式,提高所提特征的有效性,减小模型计算量。具体工作内容如下:1.提出了一种基于深度森林的冠心病自动识别算法。构建了适当尺寸的滑动窗口进行多粒度扫描,通过数据增强避免数据量对算法精度的影响。并结合分裂属性选取方式不同的完全随机森林和随机森林,实现有效特征的自动提取。对每一个级联都设置了增益比较,减少参数调节。设置了训练集占比为90%、70%和30%的三组实验,识别精度分别为99.86%、99.81%和99.58%。此外,考虑到患者缺少前期数据的临床情况,设置了训练数据和测试数据源于不同受试者的实验,识别精度为99.98%。实验证明所提算法可以有效实现冠心病的自动识别,对临床中冠心病的早诊和筛查工作具有重要意义。2.提出了一种加权平均深度森林的冠心病智能分型算法。鉴于冠心病分型对特征的高效要求,对级联中随机森林的每棵子树施加了不同的权重,减小了识别能力较弱的子树对整个模型的负影响,提高特征的有效性。改进级联的特征融合方式,对每一级联产生的多个类向量求取均值后再与原始特征向量聚合作为下一级联的输入,避免了多个具有线性关系的特征向量串联聚合引起的信息冗余和模型空间复杂化问题。设置了训练集占比分别为90%、50%和30%的三组实验,分别实现了98.94%、98.21%和97.78%的分型精度。因此,所提算法可以有效实现冠心病的智能分型。