性能势相关论文
本文采用性能势理论和方法,研究了动态控制系统的学习和优化的问题。性能势理论是学习和优化领域相当重要的一套理论和方法。基于......
本文以Markov性能势为基础,讨论G/M/1型排队系统的稳态性能灵敏度分析与优化问题。文中给出了系统极限分布与嵌入Markov链的稳......
本文将Markov性能势理论推广到了半Markov过程,在此基础上,讨论了一类具有可数状态空间的半Markov控制过程的稳态性能灵敏度分析......
本文研究了随机非线性系统的最优控制设计问题,给出了基于性能势的在线优化算法。性能势函数通过系统样本路径进行估算,优化控制可......
半马尔可夫决策过程(SMDP)可用来描述实际生活中很大一类离散事件动态系统,即半Markov系统。实际的系统不可避免地存在不确定性,而......
离散事件动态系统(DEDS)是实际生活中广泛存在的一类人造系统,而半Markov决策过程(SMDP)是这类系统建模的主要方法之一。为了适应......
学位
随着社会和科技的发展,离散事件动态系统(DEDS)的性能分析和优化应用已经成为控制与系统、管理、计算机等学科交叉领域内的一个前......
学位
作为一类特殊的随机过程,Markov过程在实际生活中有着广阔的应用领域。Markov决策过程(MDP)和半Markov决策过程(SMDP)都是描述这类......
具有抽象机制的分层强化学习方法可以实现状态空间的降维,从而解决大规模系统中的“维数灾”问题。由于引入了状态抽象机制,分层强......
随机动态系统和勒贝格采样系统在通讯网络、柔性制造、人工智能、军事指挥管理、生产生活等各个领域有着广泛的应用,是学习和优化......
基于性能势理论,对离散事件动态系统进行性能分析和性能优化时,需要计算实现因子和性能势.在这篇文章中,以遍历Markov链为模型,针对现有......
本文的工作重点是研究半Markov控制过程中的并行优化算法。首先给出一种半Markov控制过程性能势的估计算法,相对于基于实现矩阵的估......
研究一类受控闭排队网络系统的性能优化问题 .文章引进了两个基本概念 :折扣代价α 性能势和平均代价性能势 ,并且讨论了这两个性......

