论文部分内容阅读
胃癌是消化系统中最常见的恶性肿瘤之一,国家癌症中心2018年发布的报告显示,胃癌的全国发病率高居第二,仅次于肺癌,死亡率也位居第三。胃癌的形成需要经历胃癌前疾病、胃癌前病变和早期胃癌这一过程。胃癌前疾病包括胃溃疡、胃息肉、胃糜烂以及慢性胃炎等,这些疾病都伴有不同程度的炎症以及胃粘膜上皮非典型增生,可转变为癌症,所以胃癌前疾病的及时诊断有利于控制病情、降低癌变风险。传统的胃癌前疾病诊断主要依靠临床医生人工识别,需要临床医生具有丰富的工作经验并且耗时耗力。近年来,计算机视觉的快速发展和计算性能的提高为胃癌前疾病自动化识别提供了可靠的方法和机会。胃镜图像中包含了大量的数字信息,利用传统机器学习方法与近年来发展迅速的深度学习等人工智能方法,能够高通量的提取医学图像中的信息,用于临床诊断、预测和治疗效果预后。基于机器学习的图像识别需要手工设计图像的浅层特征,浅层特征仅包含颜色、纹理、空间信息等特征,缺乏深层语义特征,其识别精度不高且依赖于精心设计的医学图像处理算法;基于深度学习的图像识别可以自动地学习图像特征,但病灶大小不一和图像数量直接影响了识别精度,且分类结果仅取决于深层语义特征,忽视了图像的浅层特征。针对上述问题,本论文提出了一种基于特征融合的胃癌前疾病分类模型来自动识别胃息肉、胃溃疡、胃糜烂等三类胃癌前疾病,并构建识别系统为临床医生提供辅助诊断,支持临床决策。其中,特征融合是指对表征图像的浅层和深层信息的两类特征进行融合。图像的浅层特征包含了纹理特征、直方图特征以及分形维数特征等。本论文共提取了 75维手工浅层特征,其中直方图特征基于灰度直方图提取;纹理特征使用了灰度共生矩阵、灰度行程长度矩阵、灰度-梯度共生矩阵等方法提取;分形维数特征基于差分盒子计数法提取。图像的深层特征是通过卷积神经网络(Convolutional Neural Network,CNN)中全连接层上的神经元进行表征。为了与浅层特征数量匹配,本论文同样采用了 75个全连接层神经元,并与浅层特征串联组成新的150维定量特征,并将每个特征归一化到[-1,1]之间,以消除量纲影响。基于上述融合了图像浅层和深层信息的定量特征,本论文使用了支持向量机(Support Vector Machines,SVM)、随机森林(Random Forest,RF)、BP 神经网络等机器学习分类器对胃癌前疾病图像进行分类识别。本论文从中国某三甲医院共收集到21 1位就诊病人的胃镜图像信息。为保证疾病样本的均衡性,每类疾病从上述图像中选取380例不同图像区域的病灶样本。其中,用于浅层特征提取的病灶样本基于准确轮廓进行标记;用于深层特征提取的病灶样本采用矩形框进行标记;病灶样本均由该三甲医院中具有多年临床经验的消化科医生标记。在此基础上,采用本论文提出的特征融合模型对病灶图像进行分类识别。实验结果表明特征融合模型的分类精度最高可达95.18%,远高于基于手工特征模型74.12%的分类精度,比深度学习的卷积神经网络模型也高出2.64%,尤其在胃溃疡的分类识别中,本论文提出的特征融合模型的识别率高达98.68%。最后,本论文通过Lasso方法分析了不同类型特征与胃癌前疾病分类结果的相关性,其中前六个高相关性特征中包含了五个深层特征和一个浅层特征,表明了图像的深层特征与浅层特征对胃癌前疾病的分类识别均具有重要意义。综上所述,本论文提出的基于特征融合的胃癌前疾病分类模型在胃癌前疾病分类识别上显著优于传统的机器学习分类方法,较深度学习模型也有明显的精度提升,这表明浅层和深层特征的融合方式能够更充分地表征胃镜图像的信息,为胃癌前疾病的识别提供了新的思路和技术手段,有助于为临床医生提供更有效的辅助诊断方法。