论文部分内容阅读
提出了在动态环境中,基于冲突消解的群体智能机器人的一种协作模型,适用于环境信息不完备的复杂情况.将Agent的独立强化学习与BDI模型结合起来,使多Agent系统不但拥有强化学习的高度反应性和自适应性,而且拥有BDI的推理能力,使只使用数值分析而忽略推理环节的强化学习结合了逻辑推理方法.新的奖励函数和表示方法减少了学习空间、增加了学习速度.仿真结果表明所提方法有效.