【摘 要】
:
针对Robocup仿真组比赛中智能体的配合与动作选取,将模糊小脑神经网络(FCMAC)与传统的Q-学习相结合,提出了模糊CMAC Q-学习的方法.该方法结合了模糊控制与CMAC小脑神经网络的
【机 构】
:
江南大学,电气自动化研究所,江苏,无锡,214122
论文部分内容阅读
针对Robocup仿真组比赛中智能体的配合与动作选取,将模糊小脑神经网络(FCMAC)与传统的Q-学习相结合,提出了模糊CMAC Q-学习的方法.该方法结合了模糊控制与CMAC小脑神经网络的优点,将其运用于强化学习中,解决了连续状态空间中使用Q学习时存在的离散化及"维数灾难"的难题,并有效地增强了系统的泛化能力,提高了学习速率,增加了学习精度,更好地满足了比赛实时性的要求.将该方法运用于Robocup仿真组比赛中,证明了它的有效性.
其他文献
本文分析了长岭分公司二联合装置近年来在装置用水方面的情况,并详细介绍了节水方面所采取的措施,通过将机泵冷却用新鲜水改循环水、常压单元用脱硫净化水配碱等药剂以及替代
中国石油化工股份有限公司武汉分公司Ⅱ套重油催化裂化原料为全常底渣油,2004年2月Ⅰ套常减压装置扩能开工,Ⅱ套催化裂化装置掺炼减压蜡油,原料性质明显改善.标定表明生焦率
HSE管理体系是安全、环境、健康一体化的科学管理体系,将危害识别与风险评价的管理理念应用到直接作业环节的安全管理中,进一步强化其安全措施的落实,确保作业过程安全顺利的
本文利用场匹配的方法推导出了开放式矩形栅慢波结构的色散方程,利用数值计算方法,分别对未加载电子注时慢波结构的结构参数对高频特性以及加载电子注后注参数对小信号增益的
根据ISO14001标准,结合实践,从现代企业管理学角度,研究探讨环境主管部门在体系运行过程中的有效运作方式,并提出管理重点要素。
本文介绍去年4月底,安庆石化分公司开始实施"扁平化"管理,将原炼油、化肥、腈纶3个生产厂分解成8个作业部,作业部按大车间管理模式运行.以前的炼油厂常减压、催化裂化、催化
EPC是目前在项目施工管理中出现最为普遍的一种工程管理模式,工程分包和劳务用工在这种情形下形成了施工管理体制的一些基本特征.这种形式的劳动组合极大地活跃了劳动力市场,
“我关心巴拿马运河,因为它是我搞起来的。如果我按照老一套保守的办法,我就应该向国会提出一篇冠冕堂皇的两百来页长的咨文,引起永无休止的辩论。但是我攫取了运河,而让国
本文探讨电气安全隐患以及住宅电气设计与安装,针对住宅电气存在的安全隐患,结合有关规定,提出了住宅电气设计与安装方面的六个防范措施。
我厂PX装置属易燃易爆危险场所,为了装置安全,在该装置上设计安装了一套某公司的可燃气体检测报警系统,对现场可燃性气体的泄漏情况进行检测报警,但该系统在使用过程中暴露出的问