基于Stackelberg策略的多Agent强化学习警力巡逻路径规划

来源 :北京理工大学学报 | 被引量 : 0次 | 上传用户:ZAQWSX12344321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题,提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下,规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时性,采用了Stackelberg强均衡策略作为每个agent选择策略的依据.为了验证算法,在多个巡逻任务中进行了测试.定量和定性的实验结果证明了算法的收敛性和有效性.
其他文献
采用水热合成法在Cu2(OH)PO4表面原位沉积Ni(OH)2,制备异质结型的复合光催化剂Cu2(OH)PO4/Ni(OH)2;利用X线粉末衍射仪(XRD)、紫外-可见漫反射光谱仪(UV-Vis-DRS)和扫描电子显微镜(SEM)等,对
近几年,随着我国经济水平的不断提高,社会生态效益受到了社会各界的普遍关注,"垃圾围城"现象已成为当下突出性的环保难题。高校生活区内,学生的消费习惯与生活环境使得外卖与
通过对位于广西南宁市北郊的尾巨桉人工林进行生长特性研究。结果表明,尾巨桉人工林林分胸径、树高和蓄积量均随着林龄的增长而明显增加,其中0.5、1.5、2.5、3.5和4.5年生尾
海事执法英语是一种同时兼有海事科技术语和英语语言文本的专门用途英语,本文从词汇、文体和使用注意事项层面对其独特的语言特点进行分析与阐述,旨在为海事执法人员提供实践
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
以优良无性系172柳(Salix×fiangsuensis CL‘J-172’)为研究对象,在北京土石山地条件下研究了1a生能源林的合理栽植密度。结果表明,172柳以密度200000株,/hm^2(即株行距10cm&#
本专利介绍了一种具有优良的耐候性和机械强度且防水的聚烯烃板材的制备。该板材由部分或全部交联的组成物制得。其组分包括:(A)在茂金属催化剂存在下制备的乙烯-C6-12-a-烯烃
以临港海上风电场建设项目为背景,论述其整体施工方案,涉及海上风机选型、工作平台施工及风机安装等内容,并针对施工过程的难点提出具体解决对策,最后就监理方强化施工管理的
结合叉车变速器和液力机械传动系统运行特点,明确叉车变速器的作用,提出叉车变速器和液力机械传动系统故障检修要点,取得较好的检修效果,旨在给相关工作人员提供一定的借鉴与
首先介绍采掘现场松石清理的国内外概况;继而对松石清理机的组成及工作原理作了较主 阐述;最后对松石清理机的关键部件--冲击气缸的塞活运动进行了动力学分析,导出了瞬时速度1、冲