从单幅图像学习深度

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wl7644719
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度信息是三维场景理解的重要要素。从单幅图像学习像素级深度信息,由于不需要进行图像之间的对应点匹配等困难的操作,所以较立体视觉等基于多幅图像提取深度的方法,具有特有的优势和应用前景。然而,根据图像成像模型可知,理论上从单幅二维图像无法唯一恢复成像过程中丢失的深度信息,所以,从单幅图像恢复深度信息本质上是一个病态问题,需要借助场景先验、全局信息和局部信息进行约束求解。从机器学习推断单幅图像深度的观点看,模型学习的过程,旨在建立一种“图像表达”与“深度信息”的映射关系。所以,如何从大量图像中在统计意义下学习到合适的图像表达和映射关系,是从单幅图像学习深度的核心问题。另外,除了深度推断的质量外,如何加快推断的速度,也是从单幅图像学习深度的一个追求目标。论文围绕从单幅图像学习深度的一些关键问题进行了系统研究,主要工作有以下几方面:  1.提出了一种快速的从单幅图像学习深度信息的非参数方法  非参数深度估计的一般步骤为:先提取数据库和输入图像的全局特征,然后通过全局特征在数据库中搜索与输入图像最相似的候选图像集,据此建立候选图像和输入图像之间的稠密映射关系,并使用这种映射关系对候选图像进行深度迁移、融合和优化。这种方法一个重要的问题是计算效率低。针对这个问题,本文提出了在细尺度上的“流”通过在粗尺度上的“流”插值的计算策略,并给出了一种稀疏SIFT flow的快速方法,取得了2-3倍的加速比。同时,通过分析像素的SIFT flow描述子,将具有可区分性的统计因子加权到能量函数的数据项中,提高了深度估计的可靠性。  2.单幅图像估计深度的固有歧义性分析和变焦数据库生成  从理论上分析了从单幅图像学习深度时由于图像未知焦距导致的歧义性,并采集了真实图像数据对这种歧义性进行了实验验证。为了消除这种由焦距引起的歧义性,可靠地学习单幅图像的深度,在模型的训练和测试阶段,有必要同时考虑焦距等摄像机的内参数信息。考虑到当前从单幅图像学习深度的数据集都是固定焦距的,本文提出了一种从固定焦距数据集生成多焦距数据集的方法,并生成了两个“变焦距数据库”。针对新生成的图像中的孔洞问题,本文还提出一种通过融合邻域信息的快速孔洞填充方法,使得生成的新焦距图像更接近真实图像。  3.提出了一种充分融合网络中层信息的单幅图像深度估计方法  在充分分析当前深度卷积神经网络结构在像素深度估计方面的利与弊的基础上,提出了一种充分融合网络中层信息用于弥补空间分辨率损失的方法,提高了深度推断的准确性。在固定焦距数据集上,本文所提出的方法在各个误差度量上都超过了其它具有相同预训练结构的方法,获得了更好细粒度的单幅图像深度图。在此基础上,为了消除由焦距引起的单幅图像深度估计的歧义性,将焦距信息以全连接层的形式嵌入到了当前模型中。在生成的多焦距数据集上的大量测试表明,与没有嵌入焦距信息的模型相比,嵌入焦距信息的模型可以显著提高算法在各种误差度量上的精度。  4.提出了一种纺锤形的网络结构用于推断像素级的深度  从网络结构上来说,目前学习像素级标签的深度神经网络,一般采取Encoder-Decoder的网络结构,它们都是使用迁移学习的方法,从视觉高级任务的网络转化而来。为了直接学习单幅图像像素级的深度图,本文设计了一种纺锤形网络结构:先对输入图像进行升维处理,然后在高维空间再提取特征进行深度估计。为了克服计算机显存的限制,本文采用单幅图像的超分辨技术进行了升维操作。为了获取较广范围的全局信息,本文将膨胀卷积思想推广到了膨胀卷积核。通过和现有方法对比,发现本文所提出的方法在输入低分辨率图像的情况下,仍可以取得比较可信的深度估计。本文的纺锤形网络和实现策略,为单幅图像推断深度提供了一条新的途径,对其它像素级推断问题也具有参考价值。
其他文献
本文基于前置烧焦罐式催化裂化装置反应-再生系统动态数学模型,在gPROMS软件平台上搭建催化裂化装置仿真模块,分析其动态特性。并且利用定量的方法,将常规控制结构选择问题转化
振弦式传感器是利用振弦的固有频率随弦的张力变化而变化从而进行测量的一类装置。其频率输出的固有特性,决定了振弦式传感器易于和数字系统和计算机结合的优势,并且不会因传输
本文针对实验室的一套中和反应装置建立了一套机理模型,该模型采用每步在当前工作点(非平衡点)线性化的方法获得线性化子模型,并采用离中和点的距离替换pH值成为被控变量,降低了
建立多管多壳换热器正常/正常工况的动态机理模型,并且用来搭建一套实际原油换热网络的仿真系统,仿真得出该换热网络正常工况的操作夹点位置和非正常工况(漏流)对网络的影响,并
当前成像技术的快速发展,使数码相机、可拍照手机等设备日益普及,各种各样的图像数量飞速增长。同时,互联网的诞生与快速发展极大地促进了人们之间的信息交流,也使图像传播变得更
我国海上油气勘探和开发已进入高速发展阶段,管道的铺设量越来越大,目前总长度已超过3000公里。但由于各种原因,管道的损伤渗漏事故也在逐年攀升,一旦发生事故,不仅会造成极其严重
文字作为人类文明进步的一个重要标志,是人类交流的主要媒介。随着互联网行业的飞速发展以及拍照智能终端的广泛应用,以图像为载体的多媒体信息为人们的生活带来了极大的方便。
裂解装置是石化行业中生产能力最高、能耗也最大的装置之一,是乙烯、丙烯等石化基础原料的主要来源。随着科学技术的发展和人类需求的提高,对裂解炉的研究日益受到重视。本文针
现代交流伺服技术是人类社会的重大技术进步之一,它是电机学、电力电子学、微电子学、计算机科学、自动控制理论等多种学科的结合和交叉应用。随着电力电子技术、高速数字技
由众多传感器节点组成并相互协同工作的无线传感器网络是一种全新的信息获取和处理技术,可以广泛应用于军事、环保、安全、医疗、工农业、空间探索和灾难救援等多个领域,引起