论文部分内容阅读
实例分割是一项新兴的计算机视觉任务,广泛应用于自动驾驶、机器人抓取、工业筛检等领域。实例分割不仅需要对图像中每个实例进行像素级别分割,还需要区分每个类别的不同个体,与传统图像分割方法相比更为复杂,实现方式更为困难。现阶段基于深度学习的实例分割方法虽然分割精度较高,但无法较好应对遮挡场景,且速度较慢,针对这些问题展开研究具有意义。
本文首先介绍了实例分割的研究背景与意义、国内外研究现状;然后概述了卷积神经网络的发展历程、各部分结构以及经典的卷积神经网络;最后,针对现阶段基于深度学习的实例分割方法存在的问题提出了两种网络,具体如下:
(1)为了提升Pose2Seg的分割精度,使输出结果的边缘轮廓更加精细,提出了一种基于Pose2Seg的融合注意力实例分割网络。在设计主干网络时以ResNet为基础,引入了拆分注意力机制,使特征提取过程变得更加高效;将基于点的渲染模块应用到分割模块中,使输出结果的边缘轮廓变得更加精细。在COCOPerson数据集上,该网络的分割精度(Average Precision,AP)达到了0.555;在OCHuman数据集上该网络的AP达到了0.549,较Pose2Seg均有提升,实验结果表示该网络的输出边缘轮廓更加精细。
(2)为了减少PolarMask的参数数量以及所需浮点计算数(Floating Point Operations,FLOPs),提出了一种基于PolarMask的轻量级实例分割网络。对ResNet进行改进设计了一种轻量级的主干网络——ShiftResNeSt,在不同通道之间利用通道混合操作来实现信息共享;结合注意力机制,对每个通道赋予权重,使特征提取过程变得更加高效;基于深度可分离卷积,使用移位卷积操作替换原有的3×3空间卷积,此操作减少了卷积过程中产生的参数数量,降低了卷积过程的计算复杂度。在COCO数据集上,该网络的AP达到了0.327,参数量为26.39M,FLOPs为222.11G,在保持精度的同时减少了计算开销。
最后对全文进行了总结并对未来工作进行了展望。
本文首先介绍了实例分割的研究背景与意义、国内外研究现状;然后概述了卷积神经网络的发展历程、各部分结构以及经典的卷积神经网络;最后,针对现阶段基于深度学习的实例分割方法存在的问题提出了两种网络,具体如下:
(1)为了提升Pose2Seg的分割精度,使输出结果的边缘轮廓更加精细,提出了一种基于Pose2Seg的融合注意力实例分割网络。在设计主干网络时以ResNet为基础,引入了拆分注意力机制,使特征提取过程变得更加高效;将基于点的渲染模块应用到分割模块中,使输出结果的边缘轮廓变得更加精细。在COCOPerson数据集上,该网络的分割精度(Average Precision,AP)达到了0.555;在OCHuman数据集上该网络的AP达到了0.549,较Pose2Seg均有提升,实验结果表示该网络的输出边缘轮廓更加精细。
(2)为了减少PolarMask的参数数量以及所需浮点计算数(Floating Point Operations,FLOPs),提出了一种基于PolarMask的轻量级实例分割网络。对ResNet进行改进设计了一种轻量级的主干网络——ShiftResNeSt,在不同通道之间利用通道混合操作来实现信息共享;结合注意力机制,对每个通道赋予权重,使特征提取过程变得更加高效;基于深度可分离卷积,使用移位卷积操作替换原有的3×3空间卷积,此操作减少了卷积过程中产生的参数数量,降低了卷积过程的计算复杂度。在COCO数据集上,该网络的AP达到了0.327,参数量为26.39M,FLOPs为222.11G,在保持精度的同时减少了计算开销。
最后对全文进行了总结并对未来工作进行了展望。