基于强化学习的多机器人编队导航

来源 :辽宁工程技术大学学报 | 被引量 : 0次 | 上传用户:qncypt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多机器人系统在未知环境编队导航过程中遇到较长障碍物时,顺时针绕障和逆时针绕障的不同选择会给导航效率带来很大影响的问题,提出了一种三层强化学习方法。由高层的基于“条件-行为对”的在线学习适应环境障碍物的动态变化,中层采用角色交叉包含式控制结构保持队形,底层采用离线式常规强化学习机制获得避碰规则。仿真实验结果表明,由于只在高层保持在线学习,使学习空间得以缩小,学习时间得以缩短。该方法为复杂环境下的多机器人编队导航提供了一种有效的自主学习策略。
其他文献
从介绍糯稻新品种镇糯19品种产量水平及特征特性出发,基于安徽省舒城县引种镇糯19示范试验,阐述了安徽省舒城县引种镇糯19高产栽培技术,并论述了舒城县引种镇糯19栽培表现。
辽宁省在实施东北老工业基地振兴战略现代农业发展过程中尽管成绩突出,但也存在急需解决的问题。该文对辽宁省现代农业发展现状进行介绍,并对现代农业及新农村建设存在的问题
为了解决电子科学研究领域在研究资源共享性、协作性等问题,提出一种基于ASP脚本语言+SQL Server数据库的电子科学门户网站设计方案。阐述了电子科学门户网站的关键性技术.网站
随着我国金融市场的逐步完善和开放,国有商业银行面临着新的挑战和机遇。为了应对新的发展要求必须对存在的问题进行思考,寻求解决问题的思路和方法。行为财务管理理论的提出为
在介绍大粒豌豆新品种草原28号选育经过的基础上,阐述了其特征特性,论述了草原28号产量表现及适应地区,并从选地、施肥、播种、田间管理及收获等方面概述了其栽培技术要点.
寒富苹果大规模发展始于2005年,大部分栽植区域为新产区,缺乏成功栽植大苹果的经验.2014年辽宁省苹果栽培面积接近400万亩,其中寒富苹果栽培面积已超过130万亩,
"物价"、"拆迁"、"房价"、"食品安全""生产事故"等可以说是近两年在媒体上出现频率最高的词汇,而这些词汇的背后就是一个关于民生的大话题。面对不断上涨的物价、各地的强行拆迁、持续
综合了国内多家同类工程的经验并结合桐柏地下厂房实际地质情况,确定了厂房上部合理的开挖分层方案和边墙预裂方法.进行了垂直孔或水平孔光爆以及垂直孔预裂等开挖方案试验,
随着一个国家或地区的经济的快速发展,产业结构的不断调整,出现了产业供需矛盾尖锐,产业结构不合理,产业资源调配不均和产业资源利用效率低下等问题。如何能合理的选择主导产
阐述了基于大农业特色之路的浙江省永康市唐先镇发展现状,包括建设农业现代示范园区和粮食生产功能区、打造唐先镇田园风光旅游景观带线路及举办农业特色节等方面,为促进永康