基于模糊聚类的分层强化学习算法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:lang_yin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种新的分层强化学习Option自动生成算法,以Agent在学习初始阶段探测到的状态空间为输入,采用模糊逻辑神经元的网络进行聚类,在聚类后的各状态子集上通过经验回放学习产生内部策略集,生成Option,仿真实验结果表明了该算法的有效性。
其他文献
利用用户生物特征生成密钥和Rijndael算法作为AES的优良特性,本文提出了一种基于虹膜生物特征的密钥生成和Rijndael算法的图像加密方案。实验结果表明,该方案具有良好的加密
一、案例背景2009年,笔者参加了龙湾区教师发展中心组织的“领雁工程”活动,有幸多次聆听多位优秀老师的精彩展示课,这些老师的课堂教学都比较符合新课程理念所坚持“以学生的发
议论文是高中生必须掌握的文体之一。在作文教学中,教师只有不断地引导,培养学生的写作意识,才能使学生写好议论文。
本文利用并行程序分析软件Tuning and Analysis Utilities(TAU),对基于Message Passing Interface(MPI)的海洋环流模式Finite-Volume Coastal Ocean Model(FVCOM)2.6版本进行并行性
教育紧密地联系生活是基础教育课程改革不可或缺的内容,而道德与法治课教学是基础教育无可替代的组成部分。课堂教学紧密联系生活是初中道德与法治新课程改革的趋势,社会生活
<正>桂政发[2016]27号各市、县人民政府,自治区人民政府各组成部门、各直属机构:现将《广西招商引资三年行动计划(2016—2018年)》印发给你们,请认真组织实施。2016年6月20日
<正>桂政发[2016]19号各市、县人民政府,自治区人民政府各组成部门、各直属机构:为贯彻落实党中央、国务院决策部署,统筹我区城乡义务教育资源均衡配置,推动义务教育事业持续
近几年,提高化学实验教学质量越来越受到人们的重视,但实验教学仍然是化学教学中薄弱的一环。本文就如何在化学实验教学中进行有效的思维训练、提高实验教学的质量进行了探讨。
机载网络是一种节点快速移动、拓扑频繁变化的新型Ad Hoc网络。本文提出了一种机载网络动态TDMA的接入协议,能够同时支持单藉和产播方式,并通过RTS/CTS控制报文解决隐藏终端问题
随着素质教育的进一步发展和新课程改革的逐渐深入,教学过程越来越强调学生积极主动的学习态度,倡导学生参与、体验、探究并解决问题,这些要求呼唤教师转变教学方式,学生转变学习