随机策略相关论文
本文主要研究随机环境下连续时间马尔可夫决策过程的最优控制问题.首先我们给出一些条件证明了在有限时间里最优控制策略的存在性;......
我们在使用传统的监督学习方法做分类任务时,都希望有较多的标注数据可供学习。正所谓“见多识广”。当可供训练的数据增多时,通过......
随着移动网络的快速发展,移动蜂窝网络的能量消耗成本和碳的排放量剧烈增长,能量利用率已经成为了未来绿色节能蜂窝网络的设计准则......
随着计算机网络技术的发展和进步,以及服务带宽的不断提高,人们对视频媒体业务的需求也在日益增加,网络视频服务正处于高速发展阶......
随着课程教学改革的不断深入,人才培养模式和考核方式也发生了重大变化。作为教育的重要环节——考试方法已经成为教学改革的重点,也......
本文主要在没有Isaacs条件下,研究带有不对称信息和相关信息的两人零和微分博弈以下两类问题:即上值函数的上共轭的等价形式,以及......
我们为分布式业务系统提出了一种基于模型与预测的接入控制方法.首先,使用部分可观Markov决策过程(POMDP)来为业务系统建模.接着,......

