基于轻量型卷积神经网络的肺癌检测与分类

来源 :浙江大学 | 被引量 : 0次 | 上传用户:ylycxr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肺癌是世界上最为致命的恶性疾病之一,5年存活率仅有19%。利用医疗影像对肺癌进行早期筛查具有重要的临床意义。计算机辅助肺癌诊断技术可以实现肺部影像中肺癌的自动检测与筛查,从而帮助提升阅片工作的效率并减小阅片医生的压力。2012年卷积神经网络取得了重大突破,由此推动了计算机视觉技术的飞速发展,之后基于卷积神经网络的肺癌影像诊断工作开始大量出现。卷积神经网络由于其内部的卷积运算特性而适用于张量数据的特征计算,对于肺部影像的分析诊断也具有非常好的效果。
  本文针对肺部CT(Computed Tomography)图像中的肺癌诊断问题进行了研究。基于卷积神经网络的CT肺癌诊断主要包含两部分工作,即肺癌病变的位置检测与病理分析。我们在肺癌的位置检测与病理分析两大任务上分别提出了创新性的方法,并达到了超越同期其他方法的诊断效果。肺癌的病理分析工作通常会面临训练数据不足的问题,对此我们研究了多数据集融合学习技术,提出了一个创新性的融合学习框架并达到了优于通用融合方法的学习效果。本文贡献主要概括为:
  1.提出了一个以聚类分割方法与3D卷积神经网络相结合的肺结节检测分割框架。该框架使用了在k-means基础上经过改进的超体素聚类算法对三维的CT图像进行聚类分割,并使用轻量型的3DCNN分类模型对聚类进行分类筛选,最终可得到CT中各个肺结节的位置检测以及形状分割结果。相比于传统肺结节检测的“候选检测+假阳筛选”框架,该框架使用聚类代替了常规基于形态学判别的候选检测方法,避免了候选检测对于真实结节的漏检问题。另外,该框架仅使用轻量型的3D网络就可以共同完成肺结节检测与分割的两部分工作,具有很高的资源利用效率。实验表明该框架能够有效地完成肺结节检测分割的联合任务,并且达到比各类同期框架更优的检测效果。
  2.提出了一个轻量型的肺结节病理分类网络。网络中加入了致密的层间特征连接结构,通过将运算流中间特征进行裁剪并连接到深层网络层中,来实现每个网络层对于不同尺度特征的整合处理。该模型针对各类肺结节尺度分布范围过大的问题,实现了以单个网络整合处理多尺度结节的任务,相比于同期方法中的多级并行网络大幅度减少了参数量。我们在公开数据集上针对肺结节的良恶性分类任务以及肺结节检测的假阳筛选任务分别进行了实验。实验表明,该网络比已有肺结节分类模型包括手动特征提取模型、多级并行网络以及同类的单网络模型等具有更优的分类效果。
  3.提出了一种多数据集融合学习框架。引入多个相关数据集对网络模型进行联合训练来提升模型的泛化性,从而缓解医学图像训练数据不足的问题。该框架被设计成一个软参数共享的多任务结构,通过基础共享参数与任务独立参数的组合来构建不同数据集对应任务下的特征运算网络,从而在融合学习过程中能够适应不同训练数据集的特异数据分布,降低数据分布偏倚的负面影响。在肺癌病理分类的实验中,该框架的学习效果相比于单个模型在单个数据集上的学习表现出明显的效果提升,且相对于迁移学习和通用多任务学习等已有的融合框架更加有效地减少了数据分布偏倚的影响,达到了更优的学习效果。
其他文献
行为识别的目的在于确定序列行为数据中任意时刻的行为模式,在智能感知、医疗健康、生物神经解码和人机交互等领域具有广泛应用价值。随着传感器及物联网等技术的发展、普及,行为数据体量越来越大、类别逐渐丰富、分布特性日益复杂,在有限成本内获得的人工标注数据相对于数据整体而言则越来越稀少、单一,因而基于经典监督学习的行为识别模型越来越容易过拟合。同时,随着传感技术的快速迭代更新和行为个体及应用需求的不断改变,
学位
使用有限元分析进行产品优化设计常常是一个多次迭代的过程,而且每一次迭代一般都需要重新进行十分耗时的有限元网格划分,以支持再分析,从而大大降低了产品再分析和优化设计的效率。为了显著提高产品优化设计和变动设计过程中再分析的效率,一种有效的解决方案是通过局部网格编辑而不是进行网格重生成,实现所需要的网格变动。然而,由于现有的少量六面体网格编辑方法仅能对六面体网格进行简单编辑,实现小幅变动,并且难以保证编
随着移动互联网通讯带宽增加和智能手机移动处理能力的增强,视频的创作与传播变得越来越方便,越来越多的视频被用户创作产生。为了有效利用海量视频资源,对其蕴含的丰富语义进行理解且检索是一个很有意义的研究内容。  传统的视频理解模型往往从预先定义的类别标签出发,基于属于该类别标签视频中的内容要素训练模板,进而完成语义识别任务。这种方式存在一定程度的局限性。对于预先定义类别标签中没有覆盖到的内容要素,该方法
建筑物外立面的语法解析与语义重建是计算机视觉中重要的问题之一。在地图重建、计算机辅助设计、电影与游戏的大规模城市生成中,这项技术有着重要的应用。高效而准确的建筑物解析系统可以节省大量的手工劳动力,实现高效的城市解析,进而通过语义重建系统,可以快速灵活地重建、生成大规模的三维城市模型。建筑物外立面的解析仍然是一个具有挑战性的难题,这是由建筑物外立面较为复杂的纹理结构、光照变化和遮挡等其他因素造成的。
随着硬件设备的发展,网络服务的普及以及社交媒体的兴起,每天都有海量视频数据被源源不断地生产出来,如何从这些视频中提取有价值的信息成为一个亟待解决的问题。作为一种新兴技术手段,视频问答能够基于问题针对性地提供视频中包含的各类物体和动作等诸多相关信息,其不仅可以提升信息提取的效率,而且拥有广泛的应用场景。视频问答主要涉及到文本信息理解,视频信息理解以及两者之间的交互,其中文本信息理解的算法发展较为成熟
学位
作为计算机视觉的基础核心研究问题之一,目标跟踪算法旨在对连续视频序列中的给定物体目标进行自动化跟踪并标注其对应的位置状态。在无人车驾驶、视频监控、视频编辑、机器人视觉等领域中,目标跟踪算法都扮演着至关重要的角色。一直以来,研究者们从不同角度出发提出了各种算法用以解决一系列问题,其中包括环境复杂问题、光照变化问题、遮挡问题以及物体变形问题等等。近年来,通过协滤波器、深度学习特征提取和孪生网络等技术的
随着信息网络技术的不断进步,近年来人们已经能够在丰富的场景中见到各式各样的物联网产品,比如工业物联网和家居物联网产品等。据国际知名科技咨询机构Gartner预测,到2025年,全球物联网设备的连接数将达到416亿。不同的物联网设备因其不同的通信需求,使用了不同的无线协议。此时,不同的无线协议将同时运行,这被称为无线跨协议的场景。这些同时运行的无线协议,如果运行的载波频率一致,且未被进行合理的协同时
网络是一种常见的用于描述实体关系的数据形式,许多真实数据都可以用网络的形式表示,例如社交网络,生物信息网络,电力网络等。分析和挖掘网络数据可以帮助理解实体之间的潜在关系和规律,并在人类生活和生产环境中发挥积极作用。传统的网络数据通常以邻接矩阵的形式表示,随着数据量的增大,真实的邻接矩阵往往是高维稀疏的。这对下游应用场景将带来计算复杂度高以及难以端到端融合的困难。为了解决这个问题,网络表示学习在最近
在计算机图形学领域中用计算机辅助生成艺术风格图像是一个重要研究方向,具体研究内容包括艺术风格绘制(即非真实感绘制),图像风格化,基于草图的艺术风格图像生成,交互图像美化等以及风格迁移等。本文在计算机辅助生成艺术风格图像研究中做了进一步的探索,主要包括以下三方面的工作:  1.提出一种计算机模拟和生成流沙风格画的方法。该方法把生成流沙画风格的过程分为以下步骤,即流沙画初始化区域的生成,用户输入草图辅
现阶段,计算机网络中的攻击朝着更加复杂化和智能化的方向发展,给网络基础设施以及应用的安全性带来更为严重的威胁。例如,攻击者常常使用分布式的集群发送隐秘的流量对网络主机进行恶意探测,或者对链路进行拥塞;再如,攻击者产生规模动态变化的流量影响防御系统的性能;亦或者将流量的内容进行加密处理以规避防御系统的检测。传统的网络防御系统经常利用相对固定的策略与资源来处理上述问题,因此令攻击者在其攻击活动中占据着