基于深度学习的图像语义分割方法

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:Chinaxfhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割一直是计算机视觉领域和深度学习研究中的重要课题。深度神经网络用于图像语义分割具有三个挑战:其一,下采样层带来的分辨率减小和空间信息损失;其二,深度网络的固定感受野难以处理多尺度目标;其三,缺少有效方法用于全局上下文信息获取。本文针对这些问题,并且基于已有的工作做出了一些改进:(1)全卷积的图像语义分割方法由于卷积的局部感受野性质,没有直接建模远距离像素间的上下文依赖。本文基于循环卷积网络在图像识别领域的应用,通过横向、纵向的扫描方式将图像处理成序列,使得长短时记忆网络扩展到二维图像以直接获取全局上下文,在CamVid数据集上验证了空间长短时记忆网络的有效性。更进一步,在全卷积的模型基础上,融合低层次特征来适应多尺度物体,联合空间长短时记忆网络用于建模像素间的全局依赖,在VOC 2012数据集上取得了较好的效果。(2)针对于深度网络下采样分辨率的问题,基于空洞卷积能够同时保持特征分辨率和局部感受野的性质,提出了级联的空洞卷积用于提取更大范围的上下文信息,并且使用不互为倍数的不同扩张率改进了级联空洞卷积中的“棋盘格”问题;针对多尺度目标存在的问题,基于金字塔池化和多孔空间金字塔池化,提出了改进的并行多尺度模块,主要在多孔空间金字塔池化中并行加入1×1卷积保留以学习的特征和不同间隔的池化提取全局信息。受到编码-解码器结构的启发,本文设计了一个简单的解码器结构,通过融合低层特征分两步来上采样特征图。基于这些改进,同时集成上下文和多尺度信息有效地提升了网络在VOC 2012数据集上的分割效果。
其他文献
<正>一、当前经济责任审计在国家治理中面临的困难(一)现行审计体制和机制存在问题现行审计体制构建于改革开放之初,在制度设计上带有明显的计划经济烙印和先天性不足,无论是
随着我国农产品的规模化生产,众多学者认为,形式多样的连锁经营超市将是我国未来农产品市场发展的主力军。水果连锁店是最近十年来水果零售业的新形态,满足了社区居民购买需
目的探明小鼠两种促性腺激素受体(FSHr、LHr)在卵巢的位置分布,揭示促性腺激素(GTH)调节卵巢机制及与卵泡发育分化的关系。方法运用免疫组化ABC法对小鼠卵巢FSHr、LHr分别进
目的研究布托啡诺复合利多卡因和左旋布比卡因用于臂丛神经阻滞的镇痛效果。方法选择上肢手术患者40例,ASAⅠ或Ⅱ级,随机均分为两组,A组:0.06%布托啡诺+1%利多卡因+0.375%左
本人近期做了一个关于在校大学生对世界现代设计史课程现用教材满意情况的小调查,结果十分出人意料,但却真实地反映了现用教材在编写方面存在的一些实际问题。文章试图从教学
<正>笔者曾在第7期发文阐述解决朝鲜半岛问题的"中国方案",并以历史经验教训论证,执行"中国方案"与否将关系到解决朝鲜半岛问题的成败。随后欣喜地看到了习近平与金正恩会面
红色旅游产业作为一个新兴产业发展形态,有别于其他旅游形式。用文献资料法、系统构建法、个案研究法,对红色旅游产业中餐饮业、接待业、景观业、交通业、零售业、娱乐业等相