基于内省推理的多agent在线学习方法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:sun8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多 agent 环境下 agent 的最优策略取决于其它 agent 的策略,这使得学习目标不易被清晰定义.基于客观观察行为建模的方法并不能很好体现智能体的个体理性.本文提出基于内省推理方法的多智能体环境下智能体高效在线学习方法,将基于对手模型的客观观察行为与基于换位思考推理的主观意图推测结合起来,智能体通过内省推理能够更多地得到对手的信息.针对经典协调博弈进行仿真实验,结果表明能取得较好的协调性能. The optimal strategy of agents in multi-agent environment depends on the strategies of other agents, which makes the learning objectives difficult to be clearly defined.Objective observation based on behavioral modeling can not reflect the agent’s individual rationality.In this paper, Method based on the method of efficient online learning in the multi-agent environment, the objective observation behavior based on the opponent model is combined with the subjective intention estimation based on the transposition thinking reasoning, and the agent can obtain more opponents’ information through introspection reasoning. According to the classical coordination game simulation, the results show that better coordination can be achieved.
其他文献
维生素B_(12)是体内主要的维生素之一,它参与体内的甲基转换反应,是N~5-甲基四氢叶酸转移酶的辅酶。体内维生素B_(12)缺乏时,叶酸代谢受阻,影响DNA合成和幼红细胞分裂而导致
冬季气温下降比较明显,普通润滑油产品在气温低的情况下则变得更稠,流动性减弱,达到需要润滑部位的时间加长,致使车辆不易启动且磨损加大。所以最好选择基础黏度小、倾点低的
实施素质教育是国家教育方针规定必须遵循的教育方向,培养创新思维是素质教育的重点。美术教学对培养创新精神具有重要作用。怎样才能发挥美术教学培养创新思维和能力的重要
情景教学法(Situational Language Teaching)源于20世纪20年代,它是帕尔默等人在外语教学法的科学化、系统化方面进行了大量的研究,在继承直接法传统的基础上形成的更加 Sit
近年来,对胰岛素在原发性高血压发病中的作用引起重视。从流行病学调查、病理生理学及动物实验等研究胰岛素与高血压的关系,指出胰岛素抵抗、高胰岛素血症与高血压的内在联
0.引言近期,一台氧气运输专用车1491.427配置WD615.67机型,其正时齿轮机构出现异响且发动机突然熄火,该车拖至我单位修理厂,分解正时齿轮室后发现正时中间齿轮连续打掉了6个
党的十七大报告提出继续解放思想,坚持改革开放,推动科学发展,促进社会和谐,为夺取全面建设小康社会新胜利而奋斗。认真贯彻十七大精神,坚持走中国特色社会主义工会发展道路,
针对急倾斜中厚煤层大断面开切眼掘进过程中面临的底板问题,采用锚网支护、锚索梁支护、混凝土浇筑支护等方式进行加固支护,解决了开切眼因煤层变化造成高度不易控制容易推底
髓系白血病集落(AML-CFU)培养是当代实验血液学的有用工具,对于白血病的起源和诊断以及推测预后,都有重要的意义.近年来对AML-CFU的研究不断深入,本文对此作一综述. The cu
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊