复杂环境下的多目标动态协同对抗辅助决策方法研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:budd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的飞速发展,多智能体系统在很多领域具有了广泛应用,研究多智能体相关技术就显得越加重要。同时,随着智能体结构设计技术和数据采集技术的不断完善,根据多智能体共享的环境数据进行合理的场景态势评估以及面向指定任务进行动态的协同对抗决策就成为提高多智能体作业能力和应用价值的一个重点研究方向。为了实现合理高效的多智能体态势评估与协同对抗决策,本文在多智能体系统的研究基础上,提出了一整套改进的多智能体协同对抗决策模型。希望结合该模型,多智能体系统可以实现更为合理、精准的态势信息融合与评判,并在此基础上实现动态的集群自主决策。本文主要的研究内容和创新点为:(a)设计一种基于深度学习算法的态势评估方法为了实现更为合理、精准的态势评估,同时考虑到场景数据信息与态势评估结果之间的不确定对应关系,设计一种基于深度学习算法的态势评估方法(Deep Learning based Situation Assessment,DL-SA):首先,将场景数据统一量纲后作为深度神经网络模型输入数据,将态势标签作为输出数据;接着,按照深度学习步骤进行态势评估网络训练;最后,结合模糊理论实现态势评估结果向模糊态势向量的转换。(b)提出一种基于人工逆强化学习算法的智能决策方法为了提高决策系统对动态复杂场景的适应性和实用性,结合获取的模糊态势结果,提出一种基于人工逆强化学习算法的智能决策方法(Human Inverse Reinforcement Learning based Decision-making,HIRL-DM):首先,以模糊态势评估向量作为状态空间,进行均匀划分后获得各个状态的判定域;接着,将决策方案作为学习系统的动作集合;然后,结合BP神经网络算法和人工奖励机制实现人工逆强化学习架构设计;最后,针对半马尔科夫现象,改进累积奖励更新策略,实现一整套基于人工逆强化学习的群体协同对抗模型。(c)提出一种基于模糊控制理论的强化学习决策优化方法为了进一步提高强化学习决策方法的学习效率,减少学习时间开销,提出一种基于模糊控制理论的动态学习率调整方法(Fuzzy Control based Dynamic Learning Rate,FC-DLR):首先,将执行动作对环境的影响程度作为模糊控制系统的输入量,将学习率值作为输出量;然后,通过构建模糊推理引擎,实现了输入量到输出量的圆滑曲线映射并通过动态学习率实现学习性能加速;最后,在足球机器人协同对抗平台中进行实例验证,结果证明了本文方法的合理性和高效性。
其他文献
介绍了重庆市涪陵区食用菌产业的发展现状,分析了其发展中存在的问题,并提出建议,以期为涪陵区食用菌产业的长足发展提供参考。
目的评价鼓室完壁开放技术鼓室成形术治疗慢性中耳乳突炎的疗效.方法2001年1月至2002年12月我院收治35例37耳慢性中耳乳突炎,经术前全身、局部抗感染治疗后,行鼓室完壁开放技
目的:筛选优化沙棘粉中儿茶素的提取方法,并用HPLC测定其含量。方法:以均匀设计法优化提取条件,采用Agilent ZORBAX SB-C18柱,以甲醇—乙酸溶液(用乙酸调p H值至3.2)(25:75)为流动相
摘要 为进一步了解机直播油菜的适宜播期与种植密度,为大面积油菜机械化生产提供科学依据,南通市通州区作物栽培技术指导站进行了播期与种植密度2个因子试验。结果表明,在南通市地区直播油菜在9月25日至10月10日播种,种植密度控制在30万株/hm2,能获得高产,随着播期的推迟,种植密度的增加都对直播油菜产量带来减产。如错过适期播种,在遲播的情况下,适当增加种植密度,对提高产量有一定帮助。  关键词 直播
以2009-2010年广西桂南稻作区迟熟组品种区域试验的资料作为±据,研究特优269的丰产性和稳产性。结果表明院特优269在2年内的产量分别为8 207.55、7 589.78 kg/hm2,分别
目的建立大鼠心肌缺血-再灌注后适应模型,评价后适应及促红素的应用对大鼠缺血-再灌注心脏血流动力学和心肌酶学的影响。方法SD大鼠60只,分为4组(对照组、促红素组、后适应组
本文研究了在HCl介质中,D401螯合树脂对铂,钯的吸附性能。实验表明,在pH=2-4范围内,树脂对钯有良好的吸附性能,饱和吸附量70.5mgPd/g-R。pH≥4时对铂不吸附,钯的负载柱可用「0.1molTu+0.5molhcL」/L混合液定量洗脱,洗脱率为99.2%,
音乐用优美的旋律让人感受音乐之美,在小学的音乐教育中,通过教师的引导,让学生了解音乐背景,体会音乐故事,感受音乐魅力,陶冶情操,提升音乐素养。音乐有启迪智慧,促进智力发
文章分析了固液比控制在真空制盐蒸发结晶工艺上的重要意义,通过剖析插入式音叉振动密度计的工作原理,提出了利用插入式音叉振动式密度计实现固液比在线测量,进而实现真空制
近年来,济南市天桥区编办在加强机构编制监督检查、预防机构编制违纪违规行为等工作中进行了一些有益的探索,取得了一定成效。一、工作探索与实践(一)严把关口,全面推行和落