【摘 要】
:
本文提出一种基于过程奖赏和优先扫除的强化学习算法.以多移动机器人觅食任务的计算机仿真为手段,与手工编程的同构策略和地域型异构策略,以及基于结果奖赏和优先扫除的
【机 构】
:
中国科学技术大学自动化系,安徽,合肥,230027
【出 处】
:
中国自动化学会系统仿真专业委员会中国系统仿真学会仿真计算机与软件专业委员会2004学术年会
论文部分内容阅读
本文提出一种基于过程奖赏和优先扫除的强化学习算法.以多移动机器人觅食任务的计算机仿真为手段,与手工编程的同构策略和地域型异构策略,以及基于结果奖赏和优先扫除的强化学习算法进行对比.对比结果表明本文提出的强化学习算法能显著减少多移动机器人之间的冲突,提高系统整体性能,从而体现多机器人系统的优越性.
其他文献
硫化氢气体具有窒息性和刺激性,急性中毒可引起中枢神经系统、呼吸系统和心脏等多脏器损害[1].近年来我科收治三起污水处理中吸入硫化氢气体中毒患者共14例,其中7例患者出现
职业健康工作的目标是保障劳动者健康,保护劳动力资源.目前我国的职业卫生现场监管模式和监管能力都尚难以适应新形势下的职防任务[1].建立新型的综合信息网络联络体系和综合
微型飞行器(MAV)的自主飞行控制是目前国内外微型飞行器研究领域正在积极开展的一项研究.由于MAV具有自身尺寸微小,飞行环境复杂多变等特点,传统的飞行控制技术已非常不
该文研究了分布式组件对象模型(DCOM)的概念、DCOM的原理和特性,着重分析了如何运用DCOM技术进行炮兵射击效能仿真系统的软件开发.
1,2-二氯乙烷(1,2-DCE)中毒时有发生,其发病潜伏期较长、起病隐匿,病情可突然恶化.临床表现以中毒性脑病为主,出现脑水肿,部分重度中毒者有局灶性受损表现,如小脑共济失调、
目前的鱼雷运动模型是建立在恒定推力的基础之上的,不能准确地反映鱼雷变动工况下的系统运动特性.本文通过分析推进器在斜流中的工作情况,结合推进器的实验曲线,使用等效
产品概述:康特针对未来网络发展的特点,成功设计了VoIP系统,使运营商在开展数据业务的同时,可充分利用EPON+EoC高速数据通道,开展互联网电话业务。图1为应用该产品搭建的三网
火炮通用动力学模型是火炮系统建模的重要内容之一,所涉及的理论和方法比较多,本文就K-H多体理论在火炮通用动力学建模中的应用做一些研究,此理论有利于计算机对火炮系统
农民肺(farmer's lung disease,FLD)是外源性过敏性肺泡炎或外源性过敏性细支气管肺泡炎的一种,是最常见的过敏性肺炎(hypersensitivity pneumonitis,HP),因患者多为从事农业
本文简单介绍了一种采用数字电台进行远距离通讯的无人机远程控制飞行仿真系统的设计,并结合实践着重探讨了三维动画显示的实现方法.其中所使用的一些建模方法和一些特殊