基于禁忌搜索的option自动构造

来源 :系统仿真学报 | 被引量 : 2次 | 上传用户：shijianwu2003

【摘要】

：

通过在环境中设置禁忌状态,agent能够在与环境的交互过程中发现瓶颈状态,以及瓶颈状态之间的毗邻关系。agent根据瓶颈状态之间的毗邻关系,自动地从毗邻的瓶颈状态中挑选合适的瓶颈状态作为option子目标。同时在交互过程中获得Option的初始集,实现option的自动构造。网格环境中的导航实验验证了该方法无需人工干预就可以自动构造有用的option,即可以加快agent学习速度,也便于知识迁移,

【作者】

：

徐明亮苏晓萍须文波

【机构】

：

江南大学信息工程学院,湖州师范学院信息工程学院,

【出处】

：

系统仿真学报

【发表日期】

：

2009年23期

【关键词】

：

hierarchical reinforcement learning option subgoal tabu search Q-learning

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

提高检索性能的朝鲜语布尔查询词生成及扩展

为了提高信息检索系统的检索性能，同时方便用户的操作，本文提出一种新的方法将用户输入的朝鲜自然语句自动转换成扩展的布尔查询词．首先基于句法信息将用户输入的朝鲜自然语句生

期刊

句法分析句法树自然语言查询分解布尔检索查询扩展

飞机综合设计平台——精益研发之总体平台框架应用

引言rn精益研发平台PERA是安世亚太自主研发的旗舰产品.PERA以精益研发方法学为基础,通过CAX集成、流程管理、数据管理等信息化手段,集成了创新设计、质量设计,协同仿真、多

期刊

飞机综合设计平台平台框架integrated designapplication研发平台企业产品多学科优化自主研发质量设计知识工程研发技

浅谈钢结构工业厂房施工技术

伴随着科学的发展与时代的进步,社会经济在这种大背景中在进行着一次又一次的革新.城市化逐渐变成了一种趋势,高楼耸立变成了潮流,建筑行业也受到社会的关注.本文对工业厂房

期刊

钢结构工业厂房施工技术

BIM技术在建筑施工管理中应用的思考

当前,BIM技术已被国际工程界公认为建筑业发展的革命性技术,它的全面应用,将对建筑行业的科技进步产生无可估量的影响.在如今建筑工程的管理工作中,不时会存在着一定的问题,

期刊

BIM技术建筑工程管理应用

饮用水中16种多环芳烃的高效液相色谱-荧光-二极管阵列同时测定法

目的建立饮用水中16种多环芳烃(PAHs)的高效液相色谱-荧光-二极管阵列(HPLC-FLD-DAD)同时测定法。方法将1 L水样经Bond Elut Plexa固相萃取柱吸附,二氯甲烷和乙酸乙酯洗脱,洗

期刊

二极管阵列饮用水荧光检测高效液相色谱荧蒽多环芳烃苯并进样体积Pursuit定量下限

淀粉合成相关酶启动子的研究进展

淀粉是禾谷类作物子粒中的主要储藏化合物,广泛应用于化工、医药、纺织、造纸和建筑等领域.随着淀粉需求量的急剧增加,如何提高作物淀粉含量及改良淀粉品质是各个领域研究的

期刊

starchenzymepromoter

支持推测并行化的事务存储硬件模拟系统

多核处理器通过增加处理器核数提高计算能力,虽然可以通过同时运行多道程序的方式利用处理器资源,但是多核处理器真正的成功取决于解决并行应用开发中的难题.为此,处理器体系

期刊

多核处理器FPGA模拟器事务存储线程级推测

建筑电气工程安装技术要点分析及应用

随着我国的不断发展,人们的经济条件和生活水平都有了很大的提高,人们对建筑工程的质量要求也越来越高.而建筑电气工程安装对建筑物的使用安全性能和居住的功能都有着很大的

期刊

建筑电气工程安装技术要点分析应用

市政工程施工技术优化策略分析

先进的市政工程技术是保证市政工程质量的必要条件,在市政工程实施过程中,只有对市政工程技术进行有效的优化提升,才能有效的提高工程施工效率,保证工程的质量,使市政工程真

期刊

市政工程施工技术策略

基于BP网络与RBF网络对葡萄酒种类分类的应用研究

为将由不同农作物酿造的葡萄酒进行快速而准确地分类以满足市场的需求,从训练时间和分类正确率两个方面研究并比较了针对此类问题的BP网络和RBF网络性能。根据对葡萄酒中的13

期刊

BP网络RBF网络葡萄酒分类MATLAB测试误差收敛速度

基于禁忌搜索的option自动构造

其他学术论文