基于分层强化学习的AUV路径规划方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:gwxy110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能水下机器人(Autonomous Underwater Vehicle,AUV)是探索海洋的重要工具,对海洋开发和海洋资源探索起到了重要的作用,路径规划是智能水下机器人领域的重要技术之一,贯穿了AUV水下航行的始终,是其完成水下作业任务的基础。机器人的智能学习是近年来各个领域的研究热点,本文将分层强化学习方法应用到AUV的路径规划任务中,赋予智能机器人自学习能力,提高AUV的环境自适应性。主要研究以下几点内容:1)深入分析了分层强化学习方法的理论与应用,提出半马尔可夫决策过程,引入抽象的思想进行任务分层以解决强化学习的维数灾问题,基于MAXQ学习算法建立AUV路径规划任务的三层结构,包括:根任务层、子任务选择层、行为动作层,并为每一层设计了相应的决策策略;2)基于分层思想并结合半马尔可夫决策理论对AUV系统进行全局路径规划设计:搭建基于全局路径规划的AUV任务分层结构,建立路径规划任务的评价函数和AUV全局路径规划所需要的各个数学模型,设计了一种全局路径优化的算法弥补了栅格法搜索路径的不足,搭建AUV全局路径规划仿真平台进行仿真试验以验证算法的准确和实用性;3)基于分层强化学习方法设计AUV局部路径规划任务:建立AUV局部路径规划系统模型,为了提升学习效率和降低学习难度,采用CMAC网络来存储每个学习动作的Q值表以优化MAXQ算法,设计局部路径规划分层框架,搭建AUV局部路径规划仿真平台,进行仿真试验,表明分层强化学习提高了AUV的水下环境自适应性。本文将AUV的全局路径规划和局部路径规划结合,提高了AUV水下作业航行的效率;在路径规划模型中加入了海流因素的影响,使环境模型更加贴近于实际;利用自学习的思想,提高AUV在动态复杂海洋环境下的自适应性和自主作业能力;对于AUV安全、可靠、高效自主完成远程航海与地形勘察作业使命,具有重要理论意义及实际应用价值。
其他文献
学位
为满足高速数据业务的发展需要,CDMA2000-1X系统在核心网中引入了分组域子系统,同时相应地添加了PCF和PDSN等支持分组数据业务的网元。为了确保这些新增网元能够快速高效地参与
输流管路系统广泛地应用于各个工程领域,其振动噪声对系统本身及环境会产生不利的影响,所以开展输流管路系统动力学特性研究是十分重要的。本文首先建立输流管路系统元件传递矩阵模型,建立了直管元件、弯管元件和变截面管路元件的场传递矩阵;建立了集中质量点、弹性支撑、分支点、变径管道的点传递矩阵模型、空间变换矩阵以及边界约束矩阵;依据不同管路元件的传递矩阵模型建立了管路系统整体的传递矩阵。应用理论计算方法—传递
随着岩石表面分形技术的研究和视觉检测技术的发展,基于激光测量原理的表面轮廓仪在岩石表面数据测量,力学分形研究领域得到了广泛应用。传统测量方法通过投射点结构激光到被
数字存储示波表是近年出现的一种新型的检测仪表,主要功能覆盖数字存储示波器和数字万用表,可满足机动现场维护、后勤保障、工业生产以及教育系统等领域移动测试的需求。与台式的数字示波器相比,数字存储示波表具有轻巧、便携的特性,可以满足现场苛刻环境下的精确测量。本文结合1GSPS数字存储示波表项目的开发,围绕其软件系统的设计与实现展开研究,重点讨论了示波表的整机控制,波形运算及参数测量,波形处理及显示。具体
压气机是扩压连续旋转机构,在运行中存在叶栅附面层气流分离等情况。这种不稳定状态进一步发展,就会出现旋转失速甚至喘振。研究压气机对整个燃气轮机正常工作的影响就至关重要
学位
目的:研究肝功能检验患者实施正常标本的临床效果.方法:择取50例我院纳入的肝功能检验患者,2018年10月至2019年10月作为本研究的时间范围,分别制备溶血标本与正常标本,讨论溶