多Agent系统中Q学习算法研究

来源 :辽宁农业职业技术学院学报 | 被引量 : 0次 | 上传用户:fourstone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高多Agent系统中的典型的强化学习——Q学习的学习效率和收敛速度,充分利用环境信息和相关的专家经验,提出了改进的多Agent系统强化学习算法(Q学习算法)。该算法通过Agent间对信息的共享,有效地将Q学习算法扩展应用到多Agent系统中。
其他文献
2004年日本实行国立大学法人化改革,主要目的之一是削弱学部教授会为主的学术权力,加强校长为主的行政机构的权力,即大学管理从"教授治校"的"由下至上"模式转变为"校长治校"的"从上
洪水脉冲对渔业资源的影响在中国一直缺乏实证性研究.以长江中游为例,收集了1963-1973年、1978-1985年、1996-2010年3个时段的渔业产量和宜昌站日流量数据,定义了9个描述洪水脉冲的水文指标,采用相关分析法和逐步回归法,识别了与渔业产量显著相关的洪水指标,建立了洪水指标与渔业产量的回归方程.研究发现:长江中游的渔业产量与洪水指标之间存在正相关关系;与渔业产量显著相关的洪水指标依次是
[目的]探讨亚低温治疗仪对重症手足口病患儿中的应用效果与护理方法.[方法]将54例重症手足口病患儿按阶段性回顾法分为对照组及观察组,对照组采用传统的降温方法进行降温,观
我国现行教育评估模式是同行专家兼职评估。教育评估职业化则与此不同,其愿景是:职业化的教育评估组织及其员工,专门从事各级各类教育的评估工作。教育评估职业化以"一个中心"和
摘要:介绍了上海1号银芽柳的北方栽培技术,包括扩繁、抹芽、施肥和病虫害的发生与防治及除草、灌水等技术环节,提出了银芽柳扩繁的最佳途径为硬枝扦插,为节省穗材,插穗可剪成长约8
传统的振动主动控制方法在应用过程中,常采用线性化处理,将一些非线性过程用一系列的线性关系代替,不能得到令人满意的结果.将多变量控制的逆系统方法引入到结构振动主动控制
The logarithmic model is often used to describe the relationships between factors.It often gives good statistical characteristics.Yet,in the process of modeling
期刊
在传统的认识论视域下,教育评价存在工具性、控制性、客体性、功利性等认识误区。教育活动是一种范导性活动,教育评价作为一种规范性认识,经历了基于行为规范的教育测量、基
进入经济转型后的初期,我国地区间高等教育机会差异呈现出扩大趋势,而实行扩招政策以后,地区经济差异变化对地区高等教育机会差异变化的影响程度减弱,地区间高等教育机会的差
我国教学研究型大学的基层学术组织存在组织层次划分缺乏科学依据,层级间职能漂移与错位;基层学术组织职能上偏重教学,研究职能较弱;制度过于刚性,基层组织缺乏活力等现实问题。在