基于禁忌搜索的option自动构造

来源 :系统仿真学报 | 被引量 : 2次 | 上传用户:shijianwu2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过在环境中设置禁忌状态,agent能够在与环境的交互过程中发现瓶颈状态,以及瓶颈状态之间的毗邻关系。agent根据瓶颈状态之间的毗邻关系,自动地从毗邻的瓶颈状态中挑选合适的瓶颈状态作为option子目标。同时在交互过程中获得Option的初始集,实现option的自动构造。网格环境中的导航实验验证了该方法无需人工干预就可以自动构造有用的option,即可以加快agent学习速度,也便于知识迁移,加快相关任务的学习。
其他文献
为了提高信息检索系统的检索性能,同时方便用户的操作,本文提出一种新的方法将用户输入的朝鲜自然语句自动转换成扩展的布尔查询词.首先基于句法信息将用户输入的朝鲜自然语句生
引言rn精益研发平台PERA是安世亚太自主研发的旗舰产品.PERA以精益研发方法学为基础,通过CAX集成、流程管理、数据管理等信息化手段,集成了创新设计、质量设计,协同仿真、多
伴随着科学的发展与时代的进步,社会经济在这种大背景中在进行着一次又一次的革新.城市化逐渐变成了一种趋势,高楼耸立变成了潮流,建筑行业也受到社会的关注.本文对工业厂房
当前,BIM技术已被国际工程界公认为建筑业发展的革命性技术,它的全面应用,将对建筑行业的科技进步产生无可估量的影响.在如今建筑工程的管理工作中,不时会存在着一定的问题,
目的建立饮用水中16种多环芳烃(PAHs)的高效液相色谱-荧光-二极管阵列(HPLC-FLD-DAD)同时测定法。方法将1 L水样经Bond Elut Plexa固相萃取柱吸附,二氯甲烷和乙酸乙酯洗脱,洗
淀粉是禾谷类作物子粒中的主要储藏化合物,广泛应用于化工、医药、纺织、造纸和建筑等领域.随着淀粉需求量的急剧增加,如何提高作物淀粉含量及改良淀粉品质是各个领域研究的
多核处理器通过增加处理器核数提高计算能力,虽然可以通过同时运行多道程序的方式利用处理器资源,但是多核处理器真正的成功取决于解决并行应用开发中的难题.为此,处理器体系
随着我国的不断发展,人们的经济条件和生活水平都有了很大的提高,人们对建筑工程的质量要求也越来越高.而建筑电气工程安装对建筑物的使用安全性能和居住的功能都有着很大的
先进的市政工程技术是保证市政工程质量的必要条件,在市政工程实施过程中,只有对市政工程技术进行有效的优化提升,才能有效的提高工程施工效率,保证工程的质量,使市政工程真
为将由不同农作物酿造的葡萄酒进行快速而准确地分类以满足市场的需求,从训练时间和分类正确率两个方面研究并比较了针对此类问题的BP网络和RBF网络性能。根据对葡萄酒中的13