Q-学习算法相关硕士博士期刊学术论文

本文在分析强化学习工作机制的基础上，提出了一种基于强化学习算法的PID参数自整定方法。通过与其他算法的对比以及控制系统的鲁棒......

期刊

随着Internet技术的发展和计算机的广泛应用,基于Internet的电子商务蓬勃兴起,这给传统商务协作带来了机遇和挑战。多Agent系统在......

学位

本文研究的重点是在多Agent技术环境下探讨强化学习技术的原理以及如何改进其学习效率并提高其算法的合理性,在此研究基础上构建基......

学位

强化学习是一种无监督学习方法,使智能体能够在环境模型未知的情况下利用环境奖赏发现最优的行为序列,因此被广泛用于智能体系统中......

学位

如今，交通问题引起人们的普遍关注。为此，采用最新的科学技术成果，旨在解决交通问题的“智能运输系统”的研究正在全球范围迅速兴起。......

学位