室内场景图像的语义分割方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:hefei666_y
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是计算机视觉领域中一个重要的研究主题,其旨在将图像自动分割成若干个含有一定语义信息的区域。准确的图像语义分割是实现诸多计算机视觉任务(如场景理解与分析)的基础。近年来,随着深度神经网络被引入到图像语义分割研究中来,该项研究得到了快速的发展,在智能服务机器人、无人驾驶汽车、医学图像分析等领域中均展现出巨大的应用潜力。然而,对于环境复杂的室内场景,目前文献中基于深度神经网络的图像语义分割方法仍无法得到较为理想的分割结果。本文针对基于深度神经网络的室内场景图像语义分割中存在的一些问题展开探索和研究,主要工作包括:  1.提出了一种新的基于残差网络的图像语义分割方法。该方法主要由三个模块组成:(i)数据预处理模块:针对目前国际公开数据集中室内场景标注数据不足的问题,在该模块中设计了一种在线的数据扩充方式;(ii)改进的深度残差网络模块:设计了一种融合膨胀卷积(Dilated Convolution)和长短时记忆(Long Short-Term Memory,LSTM)的深度残差网络,以提高该网络对物体边界的定位精度;(iii)难区分像素在线选择模块:设计了一种针对难区分像素的目标损失函数,以加快网络的收敛速度并进一步提高网络的分割精度。  2.提出了一种融合场景深度信息的图像语义分割方法。该方法首先利用深度神经网络进行图像的粗分割,然后利用全连接条件随机场将图像粗分割结果与场景深度信息进行有效融合,通过求解该全连接条件随机场实现图像的精确分割。  3.提出了一种基于生成式对抗网络的图像语义分割方法。该方法引入了一种超参数自适应调节机制,对于不同的判别信息和不同的对抗损失函数,都可以较为有效地处理生成式对抗网络训练过程中可能出现的判别器反传梯度过大问题,并进一步提高了图像分割精度。
其他文献
通过对集群系统性能、体系结构及其网络负载平衡技术的研究,提供了一种使用大量商用服务器构建具有良好可扩展性和高可用性网络服务的基本构架。通过对Linux内核的TCP/IP协议栈
“专业邮件服务系统的设计与实现”是信息产业部“电子发展基金”支持的“网络多功能服务器”项目下的一个子课题。在Internet迅猛发展的今天,电子邮件已经成为信息交换的重要
舰船识别广泛应用于水上交通安全监管、海洋渔业管理以及军事侦察等方面,是天基遥感应用的研究热点之一。舰船识别的数据源主要包括合成孔径雷达(SAR)图像、可见光图像和红外
学位
云计算是一种基于互联网的IT服务提供方式,凭借高度的可扩展性和灵活性以及经济高效等优势,成为构建IT软硬件服务的首选。云数据中心作为云计算平台的基础设施包括计算、存储和
GPU的浮点峰值、访存带宽以及性能功耗比都超出同时代的CPU若干倍,成为加速计算密集型应用的引擎。然而,实际GPU程序的性能却远低于GPU的浮点峰值。比如,经过深度优化的稠密矩阵
该文通过分析远程机器人控制系统的特点,即一个外部中断驱动的周期性的迭代过程,着重研究基于Linux的实时控制系统的开发与实现.该系统针对传统机器人控制系统价格高、实时性
该文的第一部分主要讨论了门限密码体制的有关问题.公钥密码体制允许任何发送者向一个已知的接收者(或者接收者的公钥可以被验证)发送秘密信息.公钥体制也能用于数字签名.数
为了能完整的理解一个复杂的系统,就要对它建模,即从某个视点,在某种层次上详细说明被建模的系统。建模可看成一套在目标系统完成之前表达目标系统的技术,面向对象对于复杂软件系
本课题研究的重点在于对PKI中常用的密码学算法和安全协议的实现进行构件化,目标是使程序员在不需了解算法和协议细节的情况下能够使用本课题的研究成果进行安全应用的开发。