面向自主驾驶场景感知的循环神经架构

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:txzhang50
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究自主驾驶汽车的场景感知和局部路径规划这两项关键技术。其中,场景感知由于输入数据的维数较高且包含大量噪声,因此是一项极具挑战的任务。目前的场景感知算法主要利用了计算机视觉和模式识别技术。通过使用机器学习,尤其是深度学习,可大幅提高场景感知的性能。然而,深度学习中所存在的(a)数据需求量大,(b)人工标签需求量大,以及(c)缺乏可解释性这三个问题,却严重地限制了其在场景感知中的应用。为此,本文针对场景感知中的三个关键任务,分别提出了三种不同的深度学习架构,在保证场景感知性能良好的同时,较好地缓解了上述三个问题。为进一步提高自主驾驶对场景的适应性,本文也对局部路径规划算法进行了深入研究。本文的主要工作和创新点如下:(ⅰ)面向动态场景预测,提出了一种张量式循环神经网络。该模型在KTH、UCF101和KITTI数据集上的预测均方误差(目前最主要的视频预测性能指标)在现有最好算法(MCnet深度神经网络)的基础上分别降低了 22.11%、5.52%和13.57%。相比于MCnet,该模型还具备如下优势:一、能够在不引入额外参数和计算时间的情况下高效地提升性能,其参数数量仅为MCnet的74.47%,进而降低了求解参数所需的数据量,缓解了问题(a);二、引入了记忆单元卷积,通过对记忆单元中的信息流进行可视化分析,增加了其可解释性,缓解了问题(c)。(ⅱ)面向无监督多目标检测,提出了一种记忆式循环注意力网络。该模型的平均精度(目前最主要的检测性能指标)在DukeMTMC数据集上达到了现有最好算法(RRC深度神经网络)的94.78%,在TUD数据集上达到了现有最好算法(CRAFT深度神经网络)的95.16%。相比于RRC和CRAFT,该模型的优势在于:一、充分利用了参数共享机制,使得其参数数量仅为RRC的19.14%,以及CRAFT的12.58%,进而降低了求解参数所需的数据量,缓解了问题(a);二、通过最小化图像重构误差来训练其参数,因此无需人工标签,克服了问题(b);三、引入了输入记忆和注意力机制,通过对这些机制进行可视化分析,增加了其可解释性,缓解了问题(c)。(ⅲ)面向无监督多目标跟踪,提出了一种重优先化循环注意力网络。该模型的识别F-度量(目前最主要的跟踪性能指标)在DukeMTMC数据集上达到了现有最好算法(DeepCC深度神经网络)的92.38%,在TUD数据集上达到了现有最好算法(AM深度神经网络)的93.39%。相比于DeepCC和AM,该模型的优势在于:一、充分利用了参数共享机制,使得其参数数量仅为DeepCC的22.07%,以及AM的16.33%,进而降低了求解参数所需的数据量,缓解了问题(a);二、通过最小化视频重构误差来训练其参数,因此无需人工标签,克服了问题(b);三、引入了输入记忆、注意力、重优先化等机制,通过对这些机制进行可视化分析,增加了其可解释性,缓解了问题(c)。(ⅳ)提出了一种基于双过程理论的分层局部路径规划算法。该算法由多个路径规划层构成,并能够根据环境的复杂度自动选择合适的规划层;通过面向任务的规划层调度机制,算法适用于多种指定任务中的局部路径规划,包括城市道路(位于长沙市麓谷工业园区)、高速道路(长沙市绕城高速公路,其总长约85千米,累计实验路程约1000千米)、乡村道路(位于长沙市湘江孤岛,岛屿面积约1.67平方公里)和越野道路(位于某装甲车试验基地);算法的规划成功率在上述城市道路任务中达到了100.00%,在上述越野道路任务中达到了99.99%,展示了其适应性和有效性。
其他文献
科技强则国家强,科技兴则军队兴。依靠创新科技推动国防和军队建设实现新跨越,是为迎接世界局势变化带来的挑战,加速推进中国特色军事变革的必然要求。本研究以演化经济学作为基础理论,结合演化经济学中的适应性原理、复杂系统原理以及耗散结构原理,将国防科技协同创新活动视作一个具有非线性、动态性、多层次性的复杂创新系统。依照演化经济学理论中“新奇”的创生、传播、适应三个演化过程为线索,创造性地将复杂的国防科技协
“兵者,国之大事,死生之地,存亡之道,不可不察也。”战争关乎国家安危,必须运用科学的理论和方法做出正确的决策,作战行动计划质量的高低事关战争的成败,必须运用科学的方法对其进行研究。信息技术的发展使得武器装备系统之间的互联互通更加频繁,作战体系化和网络化的特征愈发明显,尤其是无人装备和集群作战样式的兴起,使得作战体系(Combat System of Systems,CSo S)网络化的趋势更加明显
习主席强调指出,“掌握思想领导是掌握一切领导的第一位。”思想政治教育是我军政治工作的重要组成部分,其根本目的就是要将我们党的精神、意志和主张灌注于官兵的头脑和灵魂之中,从而牢牢掌握官兵思想,确保我军始终置于党的绝对领导之下。当前,随着网络信息技术的迭代更新速度不断加快,各种类型的社交媒体花样翻新、层出不穷,它们一方面因为能够为广大官兵的学习、工作和生活提供极大便利而日益成为广大官兵须臾不可或缺的生
信息系统与信息管理是以信息为核心资源,以信息技术为核心能力,面向宏观与微观各层面的解决经济和管理实际问题的重要科学领域,具有“信息、技术、管理”三个重要维度。信息的爆炸式增长催生了以计算机网络为基础的分布式系统。尽管分布式系统不断演进并得到广泛推广和应用,仍然存在一些基础性问题制约其效能的充分发挥。内容同步技术就是一个典型代表。分布式场景下,都存在不同主机之间需要快速准确的内容同步需求,例如集群节
作为一种广泛使用的在线凸优化方法,在线梯度下降算法通常用来求解在线学习问题。它把在线学习的过程建模为一个连续地博弈问题。博弈的双方分别为学习者和未知环境。在每次博弈时,由学习者先出牌,它根据历史信息给出一个出牌策略,即决策模型。然后由未知环境再出牌,它根据学习者给出的决策模型给出一个损失函数,因此带来了具体的损失。大量的文献研究了在线梯度下降算法以及它的各种变种方法,并分析了它们的性能。相关工作通
卷积神经网络(Convolutional Neural Network,CNN)近年来发展势头迅猛,被广泛应用在图像识别、模式识别等领域。用于图像识别CNN的错误率从2010年的28%降至2016年的3%,已经优于人类5%的错误率。目前,大型CNN的参数数量已经达到数百万,并且每幅图像需要多达数百亿次操作。随着卷积神经网络应用场景的拓展和计算需求的继续增长,学术界和工业界展开了对CNN加速器的探索
随着计算机技术的发展,实现对人体行为的分析和理解,将人作为计算环节的一部分,是未来人本计算的发展趋势。近年来基于射频信号的行为分析技术引起了学者的广泛关注,其通过人体对射频信号的扰动特征来感知和分析人体行为,具有非接触、非视距、无需额外设备、不受光照影响等优点,可利用已有网络基础设施实现快速大规模低成本部署,具有很大的发展潜力。当前,射频行为分析已经被应用在日常行为感知、身份认证、呼吸心跳检测等众
无人值守地面传感器(Unattended Ground Sensors,UGS)系统通常简称为地面传感器系统,是由布放在监测区域地面上的传感器节点、汇聚节点和监控节点所组成的无线监测网络。传感器节点对监测区域的目标信息进行采集、处理,并以无线方式将监测信息上传至汇聚节点,最终上传至远程监控中心。UGS监测系统具有快速部署、使用便捷、成本较低等优点,在战场信息采集及要地监控等领域有广阔的应用前景。但
人脸属性预测在娱乐、安防、社交媒体等实际应用中扮演着重要角色。现有研究多采用分类和回归性能较好的经典机器学习算法对人脸单个属性进行预测,由于单属性预测算法提取的特征较浅,未能挖掘更深层的特征,人脸属性预测准确率难以达到现实应用需求。随着计算机技术的快速发展,深度学习算法能高效地获取与属性相关的浅层和深层特征,能够取得比经典学习算法更好的性能,但由于深度学习算法层数较深,需大量的训练样本,现有的公开
无线传感器网络(Wireless Sensor Network,WSN)具有灵活多变的拓扑结构和对复杂战场环境的强大适应能力,以WSN为搭载平台的精确干扰技术成为新一代电子对抗技术研究核心。然而,其庞大的传感器节点数目也为算法处理时效性带来巨大挑战。针对该问题,本文建立了具有高效运算性能的精确干扰框架并提出了具有分布式运算能力的合作定位算法和精确功率传输算法。具体工作和创新点如下:一、搭建了以分布