【摘 要】
:
In this paper we describe a new reinforcement learning approach based on different states. When the muhiagent is in coordination state, we take all coordinative
【机 构】
:
School of Computer Science and Technology
论文部分内容阅读
In this paper we describe a new reinforcement learning approach based on different states. When the muhiagent is in coordination state, we take all coordinative agents as players and choose the learning approach based on game theory. When the muhiagent is in indedependent state, we make each agent use the independent learning. We demonstrate that the proposed method on the pursuit-evasion problem can solve the dimension problems induced by both the state and the action space scale exponentially with the number of agents and no convergence problems, and we compare it with other related multiagent learning methods. Simulation experiment results show the feasibility of the algorithm.
其他文献
MR灌注成像AIF法测量多发性硬化(MS)病灶的各项参数具有可重复性,基于AIF基础的DSC-MRI灌注测量可以显示MS不同病理基础改变的病灶,能提供与MS病灶发生、发展和病灶活动以及
1985年7月2日,哥伦比亚《观察者》日报刊登了恩里克·潘纳罗萨·隆多尼奥(Enrique Penalosa Londono)一篇有关如何彻底改善哥伦比亚城市交通质量的文章.此文的作者在13年后成
本文利用虚功原理,建立了场地土液化引起的地下管道的上浮反应分析模型,用弹性地基梁来模拟地下管道,并考虑了土的非线性约束作用、管道的初始变形、液化区长度、管道的初始
通过对施甸 5 9级地震在太平等观测点的强震记录进行时—频反应谱计算 ,给出了三个方向的时—频反应谱图 ,根据时—频反应谱的特点 ,结合场地条件 ,对这些场点的震害情况进行了分析 ,指出了在结构抗震方面应注意的环节 ,并对时—频反应谱的应用进行了探讨。
龙门山断裂构造带作为川青地块与扬子地块的碰撞边界,具有特殊的构造性质及明显的分段性.根据1991年以来GPS观测结果,对其分段活动性的研究表明:断裂带运动速率北段为1.54 mm
2002年9月在香港理工大学成功地进行了带裙房高层建筑地震反应控制试验研究.设计和制作的结构模型是带3层裙房的12层高楼剪切模型,在裙房顶层与主楼之间安装单MR阻尼器形成MR
室内模拟研究不同水热条件下土壤中N2O的释放特征,有助于阐明N2O释放的水热效应机理。本文通过室内试验研究了西北地区的典型耕种土壤土娄土中N2O在不同水温变化下的释放特征,借助化学反应动力学理论对其释放机理进行了初步的探讨。结果表明:10℃和30℃下,不同含水量的土壤中N2O的浓度变化随着培养时间的延长呈"S"型曲线。可用方程C=1/[A+Bexp(-t)]来描述。随着温度的升高(10℃到30℃)
Adaptive modulation and coding (AMC) provides the flexibility to match modulation and coding scheme (MCS) to signal to interference plus noise ratio (SINR) of u
20 0 3年庐江县棉田斜纹夜蛾大发生 ,幼虫始发期较 2 0 0 0~ 2 0 0 2年早 10~ 2 2d ,分析其原因主要是 :食料丰富 ,气候条件适宜 ,自身繁殖能力强、食性杂、世代重叠严重 ,防治
Valiant load-balancing(VLB)routing scheme has drawbacks of logical full mesh,intermediate nodes(networks)and single application of topology.To address these,the