基于深度学习的实例分割方法研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:selene1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实例分割是一项新兴的计算机视觉任务,广泛应用于自动驾驶、机器人抓取、工业筛检等领域。实例分割不仅需要对图像中每个实例进行像素级别分割,还需要区分每个类别的不同个体,与传统图像分割方法相比更为复杂,实现方式更为困难。现阶段基于深度学习的实例分割方法虽然分割精度较高,但无法较好应对遮挡场景,且速度较慢,针对这些问题展开研究具有意义。
  本文首先介绍了实例分割的研究背景与意义、国内外研究现状;然后概述了卷积神经网络的发展历程、各部分结构以及经典的卷积神经网络;最后,针对现阶段基于深度学习的实例分割方法存在的问题提出了两种网络,具体如下:
  (1)为了提升Pose2Seg的分割精度,使输出结果的边缘轮廓更加精细,提出了一种基于Pose2Seg的融合注意力实例分割网络。在设计主干网络时以ResNet为基础,引入了拆分注意力机制,使特征提取过程变得更加高效;将基于点的渲染模块应用到分割模块中,使输出结果的边缘轮廓变得更加精细。在COCOPerson数据集上,该网络的分割精度(Average Precision,AP)达到了0.555;在OCHuman数据集上该网络的AP达到了0.549,较Pose2Seg均有提升,实验结果表示该网络的输出边缘轮廓更加精细。
  (2)为了减少PolarMask的参数数量以及所需浮点计算数(Floating Point Operations,FLOPs),提出了一种基于PolarMask的轻量级实例分割网络。对ResNet进行改进设计了一种轻量级的主干网络——ShiftResNeSt,在不同通道之间利用通道混合操作来实现信息共享;结合注意力机制,对每个通道赋予权重,使特征提取过程变得更加高效;基于深度可分离卷积,使用移位卷积操作替换原有的3×3空间卷积,此操作减少了卷积过程中产生的参数数量,降低了卷积过程的计算复杂度。在COCO数据集上,该网络的AP达到了0.327,参数量为26.39M,FLOPs为222.11G,在保持精度的同时减少了计算开销。
  最后对全文进行了总结并对未来工作进行了展望。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
学位
我国的煤炭资源主要集中在地下,这构成了煤矿开采独特的工作环境:矿井巷道狭小、空间受限。电磁波在非自由的空间传输时会产生各种反射而引起多径衰落(Multipath Fading),再加上巷道内的其他因素使得电磁波在巷道中的传播情况并不乐观。本文首先研究分析了井下电磁信号的传输特性和复杂的工作环境,突出其对井下无线通信系统发展的影响;然后,指出解决多径衰落问题是建立全矿井无线数字通信系统的首要任务,但