深度强化学习及在路径规划中的研究进展

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：wangxiaoxiao880523

【摘要】

：

路径规划的目的是让机器人在移动过程中既能避开障碍物,又能快速规划出最短路径。在分析基于强化学习的路径规划算法优缺点的基础上,引出能够在复杂动态环境下进行良好路径规划的典型深度强化学习DQN(DeepQ-learningNetwork)算法。深入分析了DQN算法的基本原理和局限性,对比了各种DQN变种算法的优势和不足,进而从训练算法、神经网络结构、学习机制、AC(Actor-Critic)框架的多种变形四方面进行了分类归纳。提出了目前基于深度强化学习的路径规划方法所面临的挑战和亟待解决的问题,并展望了未来的

【作者】

：

张荣霞武长旭孙同超赵增顺

【机构】

：

山东科技大学电子信息工程学院

【出处】

：

计算机工程与应用

【发表日期】

：

2021年19期

【关键词】

：

深度强化学习路径规划神经网络结构 AC框架

【基金项目】

：

中国博士后科学基金特别资助项目(2015T80717),山东省自然科学基金(ZR2020MF086)。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

支撑财政转移支付的区块链技术方案研究

为提升财政转移支付业务办理效率,提高数据安全可信程度,增强监督审查质效,充分利用区块链技术去中心化、防篡改、可追溯、公开透明的特点,提出了一种基于Hyperledger Fabric平台的转移支付系统。由中央、省、市、县四级行政区划构成区块链网络节点,按照各级财政转移支付业务特点划分出业务通道,解决了数据监督与数据隐私之间的矛盾。实验结果证明了该系统的正确性和高效性。该系统具有即时高效、安全可信和不可篡改的特性,有望改变财政转移支付监督检查方式,提升财政转移支付公平公正水平。

期刊

区块链财政转移支付HyperledgerFabric平台

用Ａｕｔｈｏｒｗａｒｅ制作闪烁文字的方法和技巧

摘要：在多媒体课件制作中，闪烁效果的演示可以起到吸引学生注意力，提醒重、难点的作用。利用Authorware制作的文字闪烁，不但闪烁效果好，而且可控性强。本文以制作“奥运宣传片”为例，介绍了利用Authorware制作文字闪烁的方法和技巧。　　关键词： Authorware 文字闪烁方法　　　　一、判断分支结构　　　　在程序设计中，基本上都是按照自上向下的顺序执行的，这在较复杂的程序中是不能满足

期刊

图标文字分支结束按钮擦除

Ｉｎｔｅｒｎｅｔ２将推出超高速互联网络

下一代互联网络Internet2即将推出超高速互联网络，理论上最高网速可达100Gbps，是现有最高网速的10倍。　　外电援引Internet2项目首席负责人道格·范豪韦林的话说，欧洲核子研究中心耗资18亿美元研制的强子对撞机预计明年5月投入使用，这项研究对网络速度提出了更高要求。超高速Internet2网络是在此项目推动下的产物。欧洲核子研究中心的物理学家也将成为全球最早使用超高速 Inter

期刊

网络网速这一核子欧洲可达

基于CenterNet的实时行人检测模型

针对传统目标检测模型不能同时兼顾检测速度和准确度的问题,提出一种新的PD-CenterNet模型。在CenterNet的基础上对网络结构和损失函数进行改进,在网络结构的上采路径中,设计基于注意力机制的特征融合模块,对低级特征和高级特性进行融合,在损失函数中通过设计α、γ、δ3个影响因子来提高正样本与降低负样本的损失,以平衡正负样本的损失。实验结果表明,相比CenterNet模型,该模型在网络结构和

期刊

PD-CenterNet网络实时检测行人检测样本不平衡损失函数特征融合

一种改进的BR-YOLOv3目标检测网络

在目标检测任务中不同目标间尺寸差异较大,导致多尺寸目标难以被有效检测。基于YOLOv3提出BR-YOLOv3目标检测网络。利用空洞卷积提升网络层感受野尺寸的特性,使用不同数量、尺寸、膨胀率的卷积构建多层并行的空洞感受野模块。通过双向特征金字塔结构实现浅深层特征的双向融合,提升浅层预测分支分类、深层预测分支目标定位能力。使用LOSS_(GIOU)定位损失函数实现目标回归过程整体化,从而降低目标漏检率

期刊

目标检测目标尺寸差异空洞感受野模块双向特征金字塔定位损失函数

基于改进YOLOV3-Tiny的海面船舰目标快速检测

为实现海面船舰目标的快速、准确检测,提出一种改进的船舰目标检测算法。在网络结构方面根据船舰目标的特点,对浅层信息进行强化重构以降低小目标的漏检率,同时引入改进的残差网络增加网络深度和降低网络参数计算量,并且采用金字塔网络进行多尺度特征融合,以兼顾图像中大小船舰目标的检测性能。在网络训练中利用迁移学习策略进行网络模型的训练,以克服船舰图像样本集有限的问题。在视频检测中利用帧间图像结构相似度进行选择性

期刊

卷积神经网络YOLO网络船舰目标检测迁移学习深度学习

跳进画框的星星

在浩瀚的天空中，有无数颗星星。有一颗星星，它很小很小，小到地上的人们根本看不清它的模样，更不知道它的名字。　　“唉——”小星星叹了长长的一口气。最近，它不太爱唱歌了，变得很喜欢叹气。　　“怎么了，小星星？遇到什么不顺心的事了吗？”旁边的一颗大星星问。　　“每天对着黑漆漆的夜空，你不觉得无聊吗？”　　“怎么会无聊呢？有了我们，黑夜才会发光啊。”　　“那有什么用？就算我们都在发光，人们也只知道月亮、金

期刊

星星小星星画家画框地上黑夜

轻量化目标检测算法研究及应用

基于卷积神经网络的目标检测算法在追求较高精度的同时,忽略了检测速度,使得算法难以在有限算力的情况下实现实时检测。在YOLO目标检测算法的基础上,采用一系列轻量化的方法,运用Mobilenetv1网络替换Darknet53基础网络,将YOLO head部分3×3标准卷积替换为深度可分离卷积,根据灵敏度对卷积层滤波器进行排序和修剪,并在嵌入式GPU TX2平台上进行C++推理部署。在VOC数据集上的测

期刊

目标检测轻量化深度可分离卷积剪枝嵌入式GPUC++推理部署

基于暗原色先验与变分正则化的图像去雾研究

现有雾天图像处理方法能够实现较好的去雾效果,但会丢失部分细节并产生噪声放大的问题。将暗原色先验与基于TV、BH规则项的变分模型相结合,提出一种新的变分去雾模型H-TVBH。根据暗原色先验原理估计图像的初始透射率,采用四叉树分解估计大气光值,将初始透射率和大气光值输入H-TVBH模型中,采用分裂Bregman算法和快速傅立叶变换并引入辅助变量和Bregman迭代参数,通过交替迭代求得优化后的透射率和

期刊

图像去雾暗原色先验变分模型分裂Bregman算法快速傅里叶变换

一种端到端的人脸对齐方法

现有的人脸对齐方法多数是非端到端的,中间过程需要大量的人工干预,导致人脸关键点检测的稳定性较差。为此,提出一种端到端的基于深度学习的人脸对齐方法。基于MobileNets系列网络的子模块,使用类VGG结构的方式进行搭建,将整张图片作为输入,采用基于深度可分离卷积模块进行特征提取,并运用改进的倒残差结构避免网络训练过程的梯度消失,减少特征损失。在此基础上将眼间距离作为正规化方法,在300W人脸数据集

期刊

人脸对齐人脸特征点特征提取深度可分离卷积倒残差结构

深度强化学习及在路径规划中的研究进展

其他学术论文