基于DDPG算法的海上无人救援技术研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:xinxing1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对海上无人救援过程中遇险目标的漂移及如何快速靠近的问题,提出一种基于深度强化学习理论的目标追踪算法,使无人搜救船在与环境交互的过程中学习到自主驾驶追踪漂移遇险目标的最优驾驶决策。在SART的辅助下,通过自主学习能够使搜救船以最短的时间追踪到漂移遇险目标。在Gazebo物理仿真器中建立三维仿真环境,基于ROS系统分别设计直线漂移轨迹和不规则漂移轨迹仿真实验,通过多次自主学习训练,验证所提方法的有效性。
其他文献
目的观察曲马朵联合咪哒唑仑对腹部术后非机械通气老年患者的镇痛镇静效果和不良反应。方法选择年龄〉60岁择期腹部手术后患者320例,随机分为试验组和对照组,每组160例。试验
目的探讨益肾散瘀法治疗前列腺增生症的临床疗效。方法将2011年9月-2012年12月就诊的良性前列腺增生62例随机分为治疗组32例和对照组30例,治疗组采用益肾散瘀法治疗,对照组采用
顾客忠诚计划是企业基于顾客对企业特定产品或服务累积购买的基础上对顾客提供涉及购买优惠、增值服务或其他奖励的一种激励计划。文章分析了连锁超市实施顾客忠诚计划存在具