论文部分内容阅读
肺癌是世界上最为致命的恶性疾病之一,5年存活率仅有19%。利用医疗影像对肺癌进行早期筛查具有重要的临床意义。计算机辅助肺癌诊断技术可以实现肺部影像中肺癌的自动检测与筛查,从而帮助提升阅片工作的效率并减小阅片医生的压力。2012年卷积神经网络取得了重大突破,由此推动了计算机视觉技术的飞速发展,之后基于卷积神经网络的肺癌影像诊断工作开始大量出现。卷积神经网络由于其内部的卷积运算特性而适用于张量数据的特征计算,对于肺部影像的分析诊断也具有非常好的效果。
本文针对肺部CT(Computed Tomography)图像中的肺癌诊断问题进行了研究。基于卷积神经网络的CT肺癌诊断主要包含两部分工作,即肺癌病变的位置检测与病理分析。我们在肺癌的位置检测与病理分析两大任务上分别提出了创新性的方法,并达到了超越同期其他方法的诊断效果。肺癌的病理分析工作通常会面临训练数据不足的问题,对此我们研究了多数据集融合学习技术,提出了一个创新性的融合学习框架并达到了优于通用融合方法的学习效果。本文贡献主要概括为:
1.提出了一个以聚类分割方法与3D卷积神经网络相结合的肺结节检测分割框架。该框架使用了在k-means基础上经过改进的超体素聚类算法对三维的CT图像进行聚类分割,并使用轻量型的3DCNN分类模型对聚类进行分类筛选,最终可得到CT中各个肺结节的位置检测以及形状分割结果。相比于传统肺结节检测的“候选检测+假阳筛选”框架,该框架使用聚类代替了常规基于形态学判别的候选检测方法,避免了候选检测对于真实结节的漏检问题。另外,该框架仅使用轻量型的3D网络就可以共同完成肺结节检测与分割的两部分工作,具有很高的资源利用效率。实验表明该框架能够有效地完成肺结节检测分割的联合任务,并且达到比各类同期框架更优的检测效果。
2.提出了一个轻量型的肺结节病理分类网络。网络中加入了致密的层间特征连接结构,通过将运算流中间特征进行裁剪并连接到深层网络层中,来实现每个网络层对于不同尺度特征的整合处理。该模型针对各类肺结节尺度分布范围过大的问题,实现了以单个网络整合处理多尺度结节的任务,相比于同期方法中的多级并行网络大幅度减少了参数量。我们在公开数据集上针对肺结节的良恶性分类任务以及肺结节检测的假阳筛选任务分别进行了实验。实验表明,该网络比已有肺结节分类模型包括手动特征提取模型、多级并行网络以及同类的单网络模型等具有更优的分类效果。
3.提出了一种多数据集融合学习框架。引入多个相关数据集对网络模型进行联合训练来提升模型的泛化性,从而缓解医学图像训练数据不足的问题。该框架被设计成一个软参数共享的多任务结构,通过基础共享参数与任务独立参数的组合来构建不同数据集对应任务下的特征运算网络,从而在融合学习过程中能够适应不同训练数据集的特异数据分布,降低数据分布偏倚的负面影响。在肺癌病理分类的实验中,该框架的学习效果相比于单个模型在单个数据集上的学习表现出明显的效果提升,且相对于迁移学习和通用多任务学习等已有的融合框架更加有效地减少了数据分布偏倚的影响,达到了更优的学习效果。
本文针对肺部CT(Computed Tomography)图像中的肺癌诊断问题进行了研究。基于卷积神经网络的CT肺癌诊断主要包含两部分工作,即肺癌病变的位置检测与病理分析。我们在肺癌的位置检测与病理分析两大任务上分别提出了创新性的方法,并达到了超越同期其他方法的诊断效果。肺癌的病理分析工作通常会面临训练数据不足的问题,对此我们研究了多数据集融合学习技术,提出了一个创新性的融合学习框架并达到了优于通用融合方法的学习效果。本文贡献主要概括为:
1.提出了一个以聚类分割方法与3D卷积神经网络相结合的肺结节检测分割框架。该框架使用了在k-means基础上经过改进的超体素聚类算法对三维的CT图像进行聚类分割,并使用轻量型的3DCNN分类模型对聚类进行分类筛选,最终可得到CT中各个肺结节的位置检测以及形状分割结果。相比于传统肺结节检测的“候选检测+假阳筛选”框架,该框架使用聚类代替了常规基于形态学判别的候选检测方法,避免了候选检测对于真实结节的漏检问题。另外,该框架仅使用轻量型的3D网络就可以共同完成肺结节检测与分割的两部分工作,具有很高的资源利用效率。实验表明该框架能够有效地完成肺结节检测分割的联合任务,并且达到比各类同期框架更优的检测效果。
2.提出了一个轻量型的肺结节病理分类网络。网络中加入了致密的层间特征连接结构,通过将运算流中间特征进行裁剪并连接到深层网络层中,来实现每个网络层对于不同尺度特征的整合处理。该模型针对各类肺结节尺度分布范围过大的问题,实现了以单个网络整合处理多尺度结节的任务,相比于同期方法中的多级并行网络大幅度减少了参数量。我们在公开数据集上针对肺结节的良恶性分类任务以及肺结节检测的假阳筛选任务分别进行了实验。实验表明,该网络比已有肺结节分类模型包括手动特征提取模型、多级并行网络以及同类的单网络模型等具有更优的分类效果。
3.提出了一种多数据集融合学习框架。引入多个相关数据集对网络模型进行联合训练来提升模型的泛化性,从而缓解医学图像训练数据不足的问题。该框架被设计成一个软参数共享的多任务结构,通过基础共享参数与任务独立参数的组合来构建不同数据集对应任务下的特征运算网络,从而在融合学习过程中能够适应不同训练数据集的特异数据分布,降低数据分布偏倚的负面影响。在肺癌病理分类的实验中,该框架的学习效果相比于单个模型在单个数据集上的学习表现出明显的效果提升,且相对于迁移学习和通用多任务学习等已有的融合框架更加有效地减少了数据分布偏倚的影响,达到了更优的学习效果。