基于特征融合和困难样例挖掘的图像语义分割

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:hlxc8k
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是视觉理解的基础,是计算机视觉领域备受关注的核心问题,其任务是对于给定图像的每一个像素进行分类,最终得到一个与输入图像大小相同的稠密预测。近年来,深度卷积神经网络(CNNs)因其在目标检测任务中的优异表现而被应用在许多图像语义分割方法之中,得到了比传统方法更好的效果。但是目前基于深度卷积神经网络的图像语义分割算法仍面临两方面挑战:一方面,对输入图像进行连续的下采样操作使得图像的分辨率被降低,导致目标位置信息的损失;另一方面,语义分割数据集大多存在样本分布不均问题,在学习过程中给予所有像素同样的权重,不利于困难样例的分类。基于以上的需要和挑战,本文旨在解决图像语义分割中对多尺度目标、细小目标和难分类目标的语义分割。本文首先介绍了图像语义分割的研究背景和研究意义,并根据目前国内外研究现状,围绕如何融合多尺度特征对深度全卷积神经网络的分割结果进行细化,以及如何提升对难分类样本的语义分割效果进行了深入研究,本文创新点有以下两方面:第一,我们设计了一个基于多尺度特征融合的端到端全卷积图像语义分割网络ResSegNet。将图像语义分割分为初步分割和分割结果细化两个不同尺度的任务:在使用基于全卷积网络的粗粒度分割器得到初步的分割结果的基础上,提出一个基于多尺度特征融合的分割残差提取器来得到多尺度分割残差,并使用一个分割修正器将两部分结果融合,最终得到精确的语义分割结果。第二,为了解决图像语义分割存在的类内和类间的样本分布不均问题,我们提出了一种困难样例挖掘方法,基于目标检测领域的Focal Loss,设计了一个用于稠密预测的加权损失函数,对难分类的像素给予较大的惩罚,从而对困难样本进行更加充分的学习,提升模型对复杂目标的语义分割能力。最后通过实验和分析验证了我们提出的基于特征融合和困难样例挖掘的图像语义分割方法的有效性,并且与其它的前沿方法进行了对比,阐明了本文方法的优越性和价值。同时本文总结了主要研究和贡献、本文算法的不足之处,以及对未来的研究方向的猜想。
其他文献
随着互联网事业的飞速发展,我国已经进入了信息化的时代。在这样的时代背景下,高中信息技术教学就显得十分重要了。但是由于各地对教学软硬件投入的差异,导致信息教学水平也
在能源日趋紧张的情况下,如何提高效率,节约能源逐渐成了社会普遍关心的问题。电动机,这个人人都知道的词,揭示了它适用范围之广,数量之大。我就结合工作中的实践,从电动机的
数学是一门重要的学科,数学的学习离不开阅读。教师在教学中,往往忽略了对学生数学阅读能力的培养,而且学生也没有重视数学阅读能力。数学也是一种语言,对数学的学习也是对语
城市公共交通网每时每刻都承载巨大的客流量,客流量的增多为公共交通网和交通智能调度带来了巨大的压力。地铁站点短时的客流预测是智能地铁调度系统中重要的决策基础与技术
本文针对锆钛砂矿山面积广、变化快等特点提出了利用"3S"技术来改变传统的国土资源巡查方式。以高分辨率卫星IKONOS影像为例,深入探讨了IKONOS卫星影像在海南锆钛砂矿山监测
很多在职业学校工作的班主任都有这样的感受:单独处理学生出现的问题,往往比较吃力,甚至有的时候付出很多心血和精力,也达不到预期的效果。但是,如果和家长联手,事情很可能会迎刃而