基于注意力机制+DenesNet的肺部X光图像分类算法

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:xiaoshen1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新冠疫情的全球性蔓延,人们对于肺部疾病也愈加关注。肺部疾病种类繁多,肺炎、气胸、肿块等都是目前比较严重的肺部疾病。在肺部病变的检测方面,X射线是目前比较常见的诊断方法,但由于肺部X光图像的影像灰雾现象,肺部病变区域重叠等问题给医生诊断肺部疾病造成了一定程度的影响。随着科学技术的成熟与进步,计算机医疗辅助系统应运而生,它对于帮助医生提高肺部疾病诊断的精度以及速度起到了一定的作用。因此,针对肺部X光图像的病变区域在形态,大小,位置等方面的多样性以及差异性而造成的特征提取难问题,本文提出了一种基于深度注意力机制+DenesNet的肺部X光图像分类方法。主要研究工作如下。
  (1)首先,使用直方图均值化对肺部X光图像进行预处理操作,来解决肺部X光图像的灰雾现象;然后,将肺部X光图像统一缩放为224×224像素,通过0.5概率的随机水平翻转进行数据增强;最后,使用ImageNet数据集的均值和方差对数据进行归一化。
  (2)使用DenesNet作为基础网络来进行数据的训练和测试。针对DenesNet网络提取特征过程中会损失空间及通道之间的关联信息的问题,提出一种注意力机制+DenesNet网络算法,通过调整注意力机制模块的位置,更好的提取特征,用以提高算法的分类精度。通过实验结果的对比,证实了提出的算法可以有效地提高肺部X光图像的分类精度。
  (3)针对数据集中正负样本不均衡以及困难样本难学习的问题,本文使用焦点损失函数(Focal loss),其优势有两个,其一是可以通过调节Focalloss的γ参数加大困难学习样本的权重,使得网络能够更加重视困难样本的学习;其二是通过Focalloss的α参数调节能够更好的解决正负样本不均衡问题,并经过理论以及实验的结果证明修改损失函数的网络分类精度有了一定的提高。
  (4)针对由于模型迁移造成的模型拟合过快问题,本文设计了一种保肺随机裁剪的预处理操作,该操作通过训练时将每次输入的肺部X光图像进行保护肺部结构的随机裁剪操作,使得网络每次训练时的数据不同来达到减缓模型拟合的作用。实验结果证实添加保肺随机裁剪操作后的网络训练拟合时间有一定的增加,网络模型分类精度有所提高。
其他文献
滚动轴承是旋转机械设备中关键零部件之一,在不同工业领域中应用广泛。但在实际工作中轴承工况不断变化导致大量有标签数据获取困难,同时传统寿命预测方法存在健康指标难以构建及寿命预测误差大的不足。因此,能够准确预测滚动轴承的剩余使用寿命对工业生产具有重大意义。本文针对不同工况滚动轴承剩余使用寿命预测提出一种方法,该方法分为状态识别与寿命预测两部分。状态识别方面:提出基于深度模型迁移的滚动轴承状态识别方法。
学位
图像是人们从客观世界获取信息的重要来源。然而,受环境以及成像设备的影响,获取的图像经常存在遮挡、扭曲、光照不均、边缘模糊等问题,导致图像中有效信息不能充分利用。这些低质量图像会给后续图像的处理,譬如图像中文本的定位与识别,带来很大的困难。目前基于深度学习算法的文本定位与识别算法在处理高质量图像时较传统的文档文本定位与识别技术有显著优势,但是在处理低质量的图像时,定位与识别效果仍然不理想。本文针对提
学位
核磁共振成像(Magnetic Resonance Imaging,MRI)过程中,由于受自身成像机制的影响,以及遵循奈奎斯特采样定理将耗费大量的采集时间,长时间的扫描操作容易引起患者感到不适,并且可能会引入运动伪影。近年来,基于生成对抗网络的压缩感知(Compressed sensing,CS)核磁共振重建算法在重建时间上有了较大的提升,但是由于原始的生成对抗网络存在训练稳定性差、困难和模式崩溃
随着信息技术与人工智能的发展,人们在日常生活中接触到的图片越来越多。图片中包含了大量的信息,因此通过文本检测与识别提取图片中的信息变得尤为重要。伴随着计算机视觉技术的快速发展,提高了人们对自然场景文本信息的检测与识别的要求。自然场景文本检测是从背景复杂的图片中得到文字的位置信息。通过检测与识别自然场景中的文本可以应用于工业自动化、车牌识别、智能机器人、智能翻译等领域。准确快速地检测场景文本成为科研
学位
语音信号是生活中最为常用的沟通信号,其中包含大量语言和情感信息。随着技术发展,其被广泛应用于智能控制、生物医疗和电子金融等多种领域,语音信号分离技术是语音识别和语音增强等技术的基础,如何在复杂环境下,对观测信号中特定语音进行准确分离具有重要研究价值。针对语音分离技术主要有两种思路,一种是基于信号处理的非深度学习方式,亦可以称其为传统算法,另一种是基于深度学习进行分离操作。本文针对传统算法中适定盲源
学位
分布式光伏并网发电系统在缓解能源危机以及生态污染等方面都发挥着重要作用,为大电网的健康发展提供了新动能。然而伴随着许多光伏电力的并网,给电力系统工作的安全性带来了更高的技术要求,其中孤岛检测为光伏并网发电系统的关键技术之一。目前防孤岛检测方法大多数在单逆变器系统中效果更为突出。然而,如果仅仅应用单逆变器系统则很难达到当前的电力需要标准。本文就多逆变器并网系统展开分析,探究怎样对主动式频率偏移检测方
随着信息时代的到来以及电商行业的快速发展,越来越多的人通过互联网发表自己对某些事物或事件的观点。商家通过分析消费者在平台上的反馈能够更加准确且快速地了解消费者对产品的需求,从而改进目标产品,并制定更合适的销售计划,以实现收益最大化。消费者通过分析他人留下的评论信息对产品有更加深入的了解,从而更好地判断出对产品的需求度。基于方面级的情感分析任务作为自然语言处理领域的一个重要研究方向,能够更加细致的对
低电压大电流整流模块是同步发电机一体化直流输出系统的核心。单一电源模块难以满足实现低电压大电流输出,而且一旦电源发生故障,整个电源系统将无法正常运作,从而难以满足正常的供电需求。因此,本文利用多个并联的具有可控整流功能的电力电子单元,直接实现低压大直流电输出,其模块化控制提高了系统控制灵活性和容错运行能力。其中均流技术是并联电力电子电源模块进行电流均匀分配的关键技术,各个并联电源模块之间电流不均会
随着中国经济的快速腾飞,私家车的数量逐年增加,这使得交通监管的压力与日俱增,城市交通问题成了我们必须要解决的问题。近年来,人工智能的迅猛发展,为城市交通问题带来了更高效的解决办法。车辆检测技术是智能交通建设中的关键技术,可为交通管理者节约更多的时间和精力。它不仅要求可以满足实时检测,更加要求准确的识别出车辆信息。随着深度学习的不断发展,使用深度学习进行车辆检测与识别的研究成为新的发展趋势。因此,本
学位
近些年来,全球的环境污染程度不断加剧,我国的绝大部分城市也都出现了不同程度的空气污染。目前我国获取空气质量数据的方法主要是在城市中设立监测站来确定污染物的浓度,再换算成空气质量指数供居民查询。但是这种方法所需仪器的成本较高,且它的检测模式是粗粒度的,无法细化到城市中的各个角落。现在是一个信息化的世界,而图像所传达得信息要比文字更加直观、高效。通过图像来检测空气质量等级可以使空气质量检测变得细粒度、
学位