【摘 要】
:
针对多智能体深度确定性策略梯度算法(MADDPG)学习训练效率低、收敛速度慢的问题,研究MADDPG算法经验优先抽取机制,提出PES-MADDPG算法.首先,分析MADDPG算法的模型和训练方法
【机 构】
:
中国人民解放军陆军工程大学指挥控制工程学院,南京210007;海军指挥学院,南京210000
论文部分内容阅读
针对多智能体深度确定性策略梯度算法(MADDPG)学习训练效率低、收敛速度慢的问题,研究MADDPG算法经验优先抽取机制,提出PES-MADDPG算法.首先,分析MADDPG算法的模型和训练方法;然后,改进多智能体经验缓存池,以策略评估函数误差和经验抽取训练频率为依据,设计优先级评估函数,以优先级作为抽取概率获取学习样本训练神经网络;最后,在合作导航和竞争对抗2类环境中进行6组对比实验,实验结果表明,经验优先抽取机制可提高MADDPG算法的训练速度,学习后的智能体具有更好的表现,同时对深度确定性策略梯度算法(DDPG)控制的多智能体训练具有一定的适用性.
其他文献
试验选择75只杂交一代绵羊,体重均在31+0.5kg,按体重大小随机分成A、B、C三组(每组设5个重复,每个重复5只).采用当地三年以上生柠条林地的花期和结实期柠条,揉碎后做粗料
随着我国经济社会持续快速发展,火灾及各类灾害事故不断增多,应急救援成为公共危机管理的一项重要内容.国务院15号令和新《消防法》将灭火和以抢救人的生命为主的应急救援
随着城市规模的不断壮大,城市用地日趋紧张,城市建筑呈现向高空和地下两极发展的特点,城市地下建筑及工程的数量快速增长,如四通八达的城市地铁交通网络、地下交通隧道,规模宏
南江黄羊快长品系经过四个世代的选育,取得了显著的遗传进展.其6月龄公、母羊平均体重分别达到32.23kg、26.56kg,分别比零世代提高36.8%和37.3%;周岁公、母羊平均体重分别达
海北藏族自治州是青海省环湖重点牧业发展区,畜牧业在全州国民经济中占重要地位,是一项主导基础产业。改革开放以来全州上下始终认真贯彻执行“立草为业,调整结构,提高总量,增
对重庆的酉州乌羊、渝东白山羊、重庆板角山羊三个地方品种的体高、体长、胸宽、胸深、胸围、初生重、断奶重、周岁体重生长发育性能和屠宰率、净肉率、眼肌面积等肉用性
利用体外产气量法研究绞股蓝皂甙对瘤胃微生物甲烷产量及体外发酵的影响.试验以0.42g羊草+0.126g玉米+0.054g豆粕为发酵底物,在60ml培养基中绞股蓝皂甙添加量分别为0(对
面向知识服务业中领域专业内容资源的多模态、智能化、精细化、知识化和重组化的碎片性管理需求,如何高效生成和应用专业知识,促进实体经济创新发展,成为共同的战略选择与难
重庆是我国重要的水禽养殖加工地区,在国内水禽产业经济中占有重要的地位。鹅肉食品是安全绿色营养食品,近年来消费呈快速增长态势,但产品加工方式单一、加工技术滞后的现实
为探讨扁穗牛鞭草在干旱胁迫下的叶片含水量相关指标的变化,本试验用10个野生品种和“重高”、“广益”2个培育品种为试验材料,在日光温室模拟干旱条件下采用盆栽方式和持