基于卷积神经网络的城市道路场景语义分割技术研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:madeshabi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割技术是在像素级别上,标注出不同类别的物体,为物体的正确识别、分类提供了丰富的视觉信息。在语义分割过程中,分割图像容易受光照、遮挡、样本分布不均等因素的影响,进而影响模型的分割效果。在自动驾驶领域,为了保证车辆能够安全驾驶,需要自动驾驶系统为车辆提供实时、准确的道路周围可行驶区域,使车辆做出正确的操作。由于城市道路环境复杂,现有的网络模型分割准确度不高,存在误判、漏判等现象,且网络模型复杂,计算量大,分割图像耗时长,无法满足自动驾驶车辆在移动端的实际需求。本文针对提升自动驾驶领域语义分割任务中分割准确度和速度的问题,研究并提出了两种改进的网络模型,具体内容和创新点如下:1.在语义分割网络模型Deeplabv3+中,分割图像受光照、重叠、遮挡等因素的影响,使得模型分割结果存在小物体容易被漏掉、形状相似的不同类别物体容易被误判,以及分割边界模糊等现象。为了解决上述问题,本文引入注意力机制,利用位置注意力模块和通道注意力模块可以捕获大量的高级上下文信息和低层语义信息,且加入注意力模块不会增加网络模型的参数量和计算量等特点,提出了一种融合注意力机制的道路场景语义分割方法。在Deeplabv3+的编码端和解码端分别引入一组并联的通道注意力模块和位置注意力模块,以捕获并输出更加精细化的结果,同时加入BN操作对数据进行归一化处理,加快了模型的收敛速度,进而提升模型的分割准确度。2.针对目前图像语义分割模型存在网络结构复杂、计算量大,很难实现其在移动端的使用等问题,本文构建了一个面向城市道路场景的轻量化实时语义分割网络模型GINet。GINet基于编-解码结构,在编码端采用Mobile Netv2结构,引入逆残差单元,构建一个轻量化网络,在逆残差单元中引入扩张卷积,增大网络的感受野,缩短模型的训练时间;引入全局平均池化层,将网络中的全连接层替换,捕获大量的全局信息,提升模型的分割准确度。在解码端,通过双线性插值上采样操作恢复图像特征,并输出精细化分割结果。本文通过对上述两种网络模型,在大型、公开的道路场景数据集Cam Vid数据集和Cityscapes数据集上进行实验,验证了本文设计方法的有效性。
其他文献
学位
随着我国铁路货物运输的不断改革,运价调整已经成为常态化趋势。神华包神铁路集团包神北线由于受国铁其余线路陆续开通及国铁接连出台的降价、“一口价”等优惠政策的影响,以及汽运、环保、限产等因素的叠加影响,地方煤外运减量严重,神华煤逐步退出包神北线运输通道,种种因素促使包神北线运量逐年下降,所以通过调整包神北线货物运输价格来增加包神北线货运量具有很大研究意义。本文首先总结了国内外对于铁路货物运输价格调整方
甘肃自古以来就是通往西域的必经之路和交通要道,沟通中西方文化的多条商贸古道在此汇聚,这里聚集了很多的民族,各民族由于宗教,文化的不同,其审美观、生产技术和礼仪规定也有所不同,而民族之间的文化融合,使建筑形式组合发了各种各样的变化,展现出极其丰富的形态。为更好的对古建筑的传统修缮技术进行有效系统的研究和总结,本文以静宁清真寺古建筑保护修缮工程为研究案例,着重研究了静宁清真寺古建筑台基、木构架、墙体、
学位
铁路作为包钢生产活动中的运输大动脉,承担着原料燃料入厂、半成品中转和产成品外发的任务,在包钢冶金物流环节中有着十分重要的地位。而取送车作业作为车站调度系统中的重要组成部分,决定了包钢铁路专用线车辆运行效率及周转时间等诸多衔接因素。但包钢铁路专用线现有作业模式仍沿用人工调度为主的作业方法,严重制约了包钢的生产力发展。所以科学合理安排取送车作业、优化行车组织,从而达到提高包钢铁路专用线作业效率及公司内
学位
学位
跨公共网络的多媒体共享和交流正成为我们日常生活中的一个重要问题。随着对安全和隐私的日益重视,如何保护多媒体数据免受窃听和滥用已引起全世界的关注。加密是最直接的保护方式。传统的分组密码已被报道不适合多媒体数据,所以可以利用混沌系统的特性来实现图像加密较好的置乱和扩散性能。受益于弗里德里希的开创性贡献,近年来,基于混沌的图像加密方案开始蓬勃发展。DNA计算由于其固有的并行性、低功耗和大量存储等内在的优
学位
在工业智能化快速发展的时代,人工智能技术为人们的生产生活带来了巨大改变,是社会运行更加高效便捷,而计算机视觉作为人工智能的重要分支,在自动驾驶、人脸识别、医学图像诊断等方面展现了巨大的潜力和应用价值。如今数字图像采集设备被广泛应用于各个领域,在丰富的图像数据的支撑下,计算机可以代替人眼高效地完成视觉信息的识别、分析和处理。然而,在户外采集的图像数据容易受到雾霾等不利天气的影响,场景目标进入成像设备