复杂连续系统的再励学习算法设计及应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:huoqiyin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对复杂连续系统设计有效的在线再励学习系统跨越从再励学习理论到实际应用的鸿沟,这是该论文所要研究的中心问题.围绕这一中心,论文按如下的线索对相关的理和技术问题作了全面的研究:离散马尔可夫过程下的快速再励学习算法-具有连续状态空间的再励学习问题-先验知识的利用.作为复杂连续系统的实例,论文主要以移动机器人的导航问题为研究平台对所提出的算法和有关方法进行了仿真实验.
其他文献
在临床儿科,小儿喘息性疾病比较常见,喘息是儿童最为常见的呼吸道症状之一,常在患有呼吸道疾病时出现,指的是气流通过气道狭窄部位形成涡流,引起气道壁振动而产生的声音.小儿
高功率放大器(HPA)是无线通信系统中的末级,也是最重要的模块之一,而功放(PA)线性度和效率常是必须权衡的两个参数。目前国内外HPA的线性化方法有:功率回退技术、包络消除和
本文研究了在30~1000MHz频率范围内,辐射骚扰检测用天线的校准方法,其中包括偶极子天线、双锥天线、对数周期天线。天线校准有很多种方法,一般分为标准场地法和标准天线法。本文
该文综述了光纤位移传感技术和汽轮机振动测量技术的发展现状.针对小汽轮机内部高温,强电磁干扰,安装空间狭小等特点,提出了一种基于激光光纤技术的汽轮机动静间隙测量方案.
在英语教学中,要改变学生对英语学习厌学、不自信的心理, 英语教师就需要针对普通高中学生英语学业水平的要求进行教学以及正向的强化, 以便能使学生对英语学习充满兴趣.同时
该文以末制导雷达为测控对象,对基于VXI总线的自动测试系统进行了研究,设计出了基于VXI总线的雷达末制导虚拟仪器式自动测试系统.经过对VXI总线的结构、雷达导引头系统结构特
本文通过对荣华二采区10
期刊
期刊
该文研究了一套完整的湿敏元件的信息采集系统,包括定点湿度发生装置,测试电路、定点湿度控制电路、监控软件和数据分析软件.在国家“九.五”科技攻关的基础上,对湿度发生装置的
矿井辅助运输管理系统能够有效减少物料流失,提高辅助运输效率和生产效率。但由于技术发展的局限性,当前系统管理较为繁杂,效率较低,占用人员较多,而且还未实现完全无纸化。本文研