动态环境下的多智能体机器人协作模型

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:king_hxr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了在动态环境中,多Agent的一种协作模型,适用于环境信息不完备的复杂情况.将Agent的独立强化学习与BDI模型结合起来,使多Agent系统不但拥有强化学习的高度反应性和自适应性,而且拥有BDI的推理能力,使只使用数值分析而忽略推理环节的强化学习结合了逻辑推理方法.使用了Borlzman选取随机动作,并且采用了新的奖励函数和表示方法,减少了学习空间,提高了学习速度.仿真结果表明所提方法可行,能够满足多Agent系统的要求. A collaborative model of multi-agent in dynamic environment is proposed, which is suitable for the complex situation of incomplete environmental information. Combining the independent reinforcement learning of Agent and BDI model makes the multi-agent system not only possess the high reactivity of intensive learning and Adaptive, and has the reasoning ability of BDI, so that intensive learning using only numerical analysis while ignoring reasoning is combined with logical reasoning methods. Borlzman uses random actions and introduces new reward functions and representations to reduce learning Space and improve the learning speed.The simulation results show that the proposed method is feasible and can meet the requirements of multi-agent system.
其他文献
从城市居民出行的生理特性出发,分析了出行者机体生理恢复的理想时间,根据人体恢复常态时间与连续出行时间、身体能量代谢的关系,得出衔接交通方式的理想换乘距离,最后总结了
目的了解临安地区市售水产品中副溶血性弧菌污染情况,并对毒力基因和药敏进行检测,为防治因副溶血性弧菌引起的食源性疾病提供依据。方法随机采集市售水产品205份,采用PCR方
目的:对中西医结合治疗急性心肌梗死的临床效果进行研究。方法 选取我院 2017 年 11 月~ 2019 年 1 月收治的急性心肌梗死患者 90 例作为研究对象,将其随机分为观 察组 45 例
主要介绍了TC4压片弯头制造过程中存在的问题及解决的方法,以及制订的合理可靠的热成型工艺。
对济钢开发的新型顶燃式热风炉进行了详细介绍,该炉具有整体结构稳定,风温高,操作安全的特点,适合热风炉新建或改造。
目前贴面修复在色泽方面还没有获得理想的效果,这可能是由于人们缺乏有关自然牙和变色牙的色泽方面知识的缘故。为了解决这个问题,区别自然牙和变色牙的色泽差异就显得非常重
小学阶段是一个人思维能力成长的关键期,而数学思维的形成对小学生的成长十分重要.应用题教学在小学数学教学中占有非常重要的地位,也是小学数学教学的重点和难点.在应用题教
以泡沫玻璃废料为主要原料,使用粉煤灰代替部分水泥,利用化学发泡法制备泡沫玻璃废料保温发泡制品,研究了在不同配比下的泡沫玻璃废料保温发泡制品的物理性能。结果表明,制作产品
目的探讨依达拉奉对局灶性脑缺血-再灌注损伤的影响及其可能的神经保护机制。方法用线栓法制备大鼠局灶性脑缺血.再灌注损伤模型,用试剂盒检测脑组织丙二醛(MDA)含量和一氧化氮合
化学是一门以实验为基础的学科,实验有助于学生对化学知识的理解,激励学生探究化学的奥秘,增进学生对化学的情感,也是实现有效教学的重要手段。如何有效开展初中化学实验教学