基于观测的POMDP优化算法及其仿真

来源 :信息与控制 | 被引量 : 0次 | 上传用户:wzy1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分析马尔可夫决策过程(Markov Decision Process,MDP)性能灵敏度的基础上,讨论了部分可观测马尔可夫决策过程(Partially Observable Markov Decision Process,POMDP)的性能优化问题.给出了POMDP性能灵敏度分析公式,并以此为基础提出了两种基于观测的POMDP优化算法:策略梯度优化算法和策略迭代优化算法.最后以准许控制问题为仿真实例,验证了这两个算法的有效性.
其他文献
介绍一种适于糖厂甘蔗收购取样用,取样管能左右移动,出料装置工作可靠,集机、电、液于一体的甘蔗取样机.
历史上的练湖不仅是一个具有防洪灌溉功能的地方水利工程,更在济运通漕方面起着重要作用。唐代之后,朝野间围绕练湖的水利存废、湖事诉讼、工程建设产生了大量的案牍文献。明
随着我国经济的快速发展,人们生活质量的提升,我国的生态环境受到了重大的威胁,为了改善这一难题,提升我国环境质量,我国相关部门提出了一系列应对措施,比如植树造林。植树造
经济发展和旅游业的兴起为铜仁带来大量流动人口,铜仁的酒店行业也应运而起,但是目前铜仁的酒店行业种类多而杂,虽然有几家高档星级酒店,但是整体来说铜仁酒店业没有特色,没
一“我开始写东西的时候,期望值很低。在这个国家里,选择当一个短篇小说家或一个诗人,基本就等于让自己生活在阴影里,不会有人注意。”1983年对于美国作家卡佛而言,无疑是幸
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
为了在系统结构简单的前提下实现凸面光栅成像光谱仪的大相对孔径、高分辨率成像、轻小型化以及系统的易加工装调,优化设计了一种基于变间距凸面光栅的消像差凸面光栅成像光
义乌的很多中小企业,职业经理人的平均寿命都不足一年,甚至,一个企业一年换三、四个职业经理人。浙江宁波的企业也同样存在这样一个问题。在企业正从家族式管理向现代企业管理转
简要介绍了魔芋在食品、医学和工业上的应用以及魔芋产品的加工方法.
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技