【摘 要】
:
人工智能如今已经成为一项热门的技术,自动驾驶,自主导航机器人,无人机等领域的研发更是受到了研究人员的广泛关注。若要实现汽车的自主驾驶,则必须要获得现实场景的三维结构和自身的位姿信息。以往获得这些信息往往依赖激光传感器等昂贵的传感器,为了降低成本,研究利用视觉算法从图像恢复场景的三维结构和自身的位姿信息是很有必要的。由于算力的提升和大数据的支撑,深度学习技术得到了很好的发展和广泛的应用。近年来的研究
论文部分内容阅读
人工智能如今已经成为一项热门的技术,自动驾驶,自主导航机器人,无人机等领域的研发更是受到了研究人员的广泛关注。若要实现汽车的自主驾驶,则必须要获得现实场景的三维结构和自身的位姿信息。以往获得这些信息往往依赖激光传感器等昂贵的传感器,为了降低成本,研究利用视觉算法从图像恢复场景的三维结构和自身的位姿信息是很有必要的。由于算力的提升和大数据的支撑,深度学习技术得到了很好的发展和广泛的应用。近年来的研究工作开始利用深度学习算法来预测场景的深度和位姿信息。最初,研究人员使用深度真值(groundtruth)和位姿真值作为监督信号,训练网络模型学习场景的深度和位姿。然而,有监督的学习方法需要获得场景的真值,而获得真值的成本是昂贵的。因此,无监督的方法受到领域内广泛的关注。由于现实场景的复杂性和缺乏标签数据作为监督信号,无监督的方法仍然存在较大的改进空间。本文对无监督单目深度学习的方法进行改进,提高深度估计和位姿估计的性能。本文主要从网络设计,损失函数,训练策略进行改进,具体的工作和贡献如下:(1)本文对当前的无监督方法进行分析,分析领域内存在的问题和改进空间,对当前无监督方法进行实验,对其网络结构和损失函数的合理性,优势,改进点进行分析,最后提出本文的解决方案。(2)由于无监督方法的训练信号是目标图像与合成图像之间的光度误差,合成图像的准确性决定网络输出的深度和位姿的准确性。因此,本文引入生成式对抗网络(GAN)作为本文方法的网络框架,通过GAN强大的性能生成准确的合成图像,提高深度估计和位姿估计的精度。(3)本文在网络结构中引入自注意力模块,来使得网络能够关联全局信息,建立长距离的依赖,有助于提高深度估计的准确率。改善以往工作存在的深度模糊,细节丢失的问题(4)为了克服GAN难以训练和模式坍塌的问题,本文使用WGAN-GP的梯度惩罚对GAN的目标函数进行改进。同时,使用双时间尺度更新策略对GAN的生成器和判别器进行更新,进一步稳定GAN的训练。(5)本文在公共大型的数据集KITTI上进行了大量的实验,并证明本文提出的方案要优于以往提出的方法,而且能够获得准确的深度和位姿结果。
其他文献
马蹄焰玻璃窑炉是生产玻璃的热工设备。蓄热室作为一种马蹄焰玻璃窑炉的典型的能源回收设备,在热工领域上发挥重要作用。对蓄热室进行能效优化有利用节省成本和保护环境。如何实现蓄热室模型的构建和优化是解决其能耗问题的关键。目前,蓄热室的建模方法主要有实验法、解析法和数值模拟法。实验法因其材料和人工成本,存在不足。解析法因数学公式难以精确表达蓄热室物理过程,也有不足。数值模拟法只需在计算机上进行,方便实现的特
随着工业生产的发展,机器人的离线编程与示教逐渐满足不了工业要求。目前生产线从单一化产品生产向多元化产品混批生产转变,而且人机协作的要求也逐渐增多,因此也产生了工作环境包括了人的变化以及动态的生产线,缺乏灵活性的传统机器人局限性越发明显。因此增强机器人的智能化程度是机器人在工业生产线应用的一个重要环节。而视觉作为机器人的一个主要感知来源,深度学习能赋予机器人学习认知的能力,能够解决生产线上的工件位置
随着科技的发展,学生的专注程度自动分析正在成为人工智能和教育领域的一个重要交叉课题。它可以应用于人工智能辅助教育、仿人服务机器人、机器人学伴或机器人老师等智能交互系统中,通过智能系统来判断学生的学习状态,并向教师或家长提供反馈,或作为人机交互的某种决策依据。相比于传统的人工识别方法,以及基于单一信息的识别方法,利用多特征融合策略结合机器学习的自动专注度识别方法具有明显优势。但是,专注度自动识别是一
作为地球的一员,在享受大自然带来福报的同时,更应当学会对大自然的保护,促进自然资源的可持续发展。生活垃圾的处理与环境保护息息相关,作为城市的居民,应当做好生活垃圾分类,为环境保护贡献一份力量。但随着生活垃圾种类不断增多,不同城市生活垃圾分类标准存在差异,这成为目前生活垃圾分类最大的困扰。本文在此背景下,为生活垃圾分类建立深度学习模型,并不断对模型进行改进和优化,最后将模型部署在移动设备上,帮助人们
强化学习作为人工智能领域的新星,成功地解决了序列决策问题。它与机器人结合,有利于非结构化环境的操作任务。随着实际任务的复杂化,突破单个机器人能力的限制亟待解决,因此智能化的双机械臂的协作应运而生。本文以多智能体强化学习为算法框架,针对该领域探索以及数据利用等问题,以具备协作策略的双机械臂作为研究对象,旨在实现机器人合作以及自主抓夹的相关问题,并从算法优化的层面展开深入探讨。主要内容包括以下四个方面
企业创新主要过程在于通过技术创新活动驱动开发新产品,其核心是产品创新。在知识经济带动及科学技术迅速发展的信息时代,企业要想适应严峻市场挑战,打造未来成长空间,良性可持续发展,取得渐进式或激进式突破,与发达国家跨国公司开展竞争,必须重视产品创新。产品概念设计环节是整个产品研发周期中最具创新性的关键节点,此过程可变因素比较多,各设计目标要素及系统特征常处于一种不具体、不清晰的模糊状态,造成对产品功能设
配电线路是电力系统中重要的组成部分,担负着电力系统中将电能传输至电力用户的重任。目前城市配网线路以电缆线路为主,山区配网线路以架空线路为主。虽然在线路运行中电缆线路的供电可靠性高,故障率低,但也经常会遭遇绝缘老化,外力破坏等引起的故障停电,而架空线路面临的故障因素更多如:雷击、绝缘设备损坏、断线、树木超高引起的接地等。因此如何提高配网线路的供电可靠性,以及在配网线路及设备发生故障时快速实现故障快定
随着人们的出行需求越来越大,汽车工业随之得到了迅猛的发展,对车辆的各项性能要求也随之提高。在车辆的众多结构中,悬架是对车辆的操纵稳定性和舒适性起决定性作用的系统之一。空气弹簧悬架由于能够明显提升车辆的各项性能、适应行驶过程中的不同工况,且具有噪声小、质量轻、刚度可调等优点,逐渐取代了传统钢板弹簧悬架的地位。针对空气悬架对车辆性能的影响,本文主要对空气悬架的充放气控制进行研究:首先,在查阅大量文献的
深度学习的蓬勃发展在机器学习领域引起了巨大的浪潮和改革,诸如智能语音答疑、计算机视觉、数据挖掘和信息检索等方面,社交网络节点分类就是其中一个分支。这些任务中的数据通常表示在欧几里德空间。但是现在越来越多的应用程序产生的数据可以根据其社交网络的特征自然演化为图这种新颖的数据形式,表达在非欧几里得空间。这样的就对传统的相关领域算法提出了一个巨大的挑战。然而,近几年的图节点分类方法仍存在许多的不足:(1
细胞计数在临床诊断、生物分子检测、环境检测与气候变化等领域都拥有着不可替代的作用。但现今应用最多的细胞计数方式依旧是显微镜计数、图像法计数和基于荧光技术的流式细胞仪,而这些计数装置大多体积较大、价格昂贵、前处理时间长,并且需要对目标样本进行标记处理,极大地耗费了计数时间和增加计数成本。基于微流控的阻抗法流式细胞计数仪由于其便携性、非侵入性和无标签的特点使得其在替代传统细胞计数上有着广阔的前景,但由