分层强化学习相关硕士博士期刊学术论文

分层强化学习相关论文

基于分层强化学习的自动驾驶车辆掉头问题研究

调头任务是自动驾驶研究的内容之一，大多数在城市规范道路下的方案无法在非规范道路上实施。针对这一问题，建立了一种车辆掉头动力学......

期刊

分层强化学习汽车掉头稀疏奖励近端策略优化

基于分层强化学习的电动汽车充电引导方法

为了有效解决电动汽车充电目的地优化和充电路径规划问题，以及充电引导的在线实时决策问题，建立了考虑多种不确定因素的电动汽车充电......

期刊

电动汽车分层强化学习充电引导路径规划深度强化学习实时决策

基于深度强化学习的自主代客泊车路径规划方法研究

自主代客泊车应用场景封闭,场景内车辆行驶速度低,被认为是自动驾驶领域最先实现应用的技术。路径规划作为自主代客泊车系统的关键......

学位

自主代客泊车路径规划深度强化学习分层强化学习迁移学习

深度强化学习辅助的UGV导航优化

无人地面车辆（Unmanned Ground Vehicle）是社会高速发展的时代产物,推动相关技术已成为国际竞争的新焦点。自主导航（navigation）是UGV......

学位

无人地面系统路径优化路径跟随动态环境导航分层强化学习

基于推荐的引导式对话技术研究

随着深度学习技术的蓬勃发展,对话系统的研究和应用迅速增长,如Siri、Cortana、谷歌助手等。相应地,这些产品也成为长辈和孩子的情......

学位

对话推荐强化学习分层强化学习

强化学习中复杂环境的解析与重构

强化学习是目前的一种通过与环境交互试错来学习出最优策略的机器学习领域,相较于给定数据集的监督学习,强化学习其自主与环境交互......

学位

机器学习强化学习分层强化学习任务分解

多场景下车联网资源分配管理方案研究

随着车联网技术的不断发展,给人们的出行生活带来了很多的便利。面对迅速增加的车载用户,车联网将产生大量的服务请求信息。这些大......

学位

车联网云计算边缘计算资源分配分层强化学习

基于深度强化学习的移动机器人导航策略研究

移动机器人在经济社会中有着广泛的应用,覆盖了工业、农业、商业等领域。自主导航能力是移动机器人最基础的功能,移动机器人的其他......

学位

分层强化学习记忆内存无图导航移动机器人路径规划

一种通信对抗干扰资源分配智能决策算法

针对战场通信对抗智能决策问题,该文基于整体对抗思想提出一种基于自举专家轨迹分层强化学习的干扰资源分配决策算法(BHJM),算法针......

期刊

智能干扰决策分层强化学习干扰资源分配专家轨迹

基于分层强化学习的联合作战仿真作战决策算法

如何对复杂装备体系进行有效的认知决策,一直以来都是联合作战研究领域中的热点与难点,采用一种具有较强适应性的决策算法,对于应......

期刊

联合作战作战仿真作战决策分层强化学习近端优化

分层强化学习的研究及其在多智能体环境中的应用

近年来，人们在强化学习领域的研究已经取得了令人瞩目的成就。然而在场景较为复杂时，传统的强化学习算法面临维度灾难以及长期信度分......

学位

分层强化学习多智能体环境强化学习算法分配问题学习框架维度灾难估计问题多智能体强化学习值函数有效性信度场景

强化学习算法在超视距空战辅助决策上的应用研究

摘要：针对近端策略优化算法在空战智能决策过程中面临的动作空间过大、难收敛等问题，提出基于option的近端策略分层优化算法，构建了基......

期刊

超视距空战智能决策人工智能强化学习近端策略优化算法分层强化学习

基于分层强化学习的移动机器人路径规划

随着各个科技领域的进步,移动机器人应用越来越广泛,移动机器人的研究与开发也越来越受到人们的重视。在移动机器人的研究中,路径......

学位

路径规划分层强化学习值函数分解小脑神经网络

基于Option自动生成的分层强化学习方法研究

强化学习通过试错与环境交互而获得策略的改进,其自学习和在线学习的特点使其在实际中获得了越来越广泛的应用。但是,强化学习一直......

学位

分层强化学习蚁群聚类算法自动分层 Option

基于分层强化学习的多agent路径规划与编队方法研究

多agent系统的研究是当今人工智能和自动化控制领域的最前沿方向。多agent系统在各行各业中都表现出了极大的应用性,其自身所具有......

学位

多agent系统路径规划编队控制分层强化学习人工势场神经网络

连续时间分层强化学习算法

分层强化学习,如Option、MAXQ等,通过引入抽象机制来解决大规模系统的“维数灾”问题,并具有加速策略学习的功能。Option算法是运......

学位

半Markov决策过程(SMDP) 多Agent系统性能势 Q学习分层强化学习(HRL) Option

基于分层强化学习和偏好逻辑的Web服务组合研究

Web服务作为一种新兴的Web应用模式，是Web上数据和信息集成的有效机制。它被定义为使用标准的技术与其他服务进行交互的软件模块和......

学位

Web服务动态服务组合分层强化学习偏好逻辑

解决强化学习中维数灾问题的方法研究

针对强化学习任务中存在的“维数灾”(即状态空间的大小随着特征数量的增加而发生指数级的增长)及收敛速度慢两个普遍且严重的问题......

学位

强化学习分层强化学习神经网络俄罗斯方块 “维数灾”

连续时间统一MAXQ算法及其应用研究

具有抽象机制的分层强化学习方法可以实现状态空间的降维,从而解决大规模系统中的“维数灾”问题。由于引入了状态抽象机制,分层强......

学位

半Markov决策过程(SMDP) 多Agent半Markov决策过程(MSMDP) 性能势 MAXQ算法 Web服务组合

分层强化学习中自动分层算法的研究

在强化学习的实际应用中,“维数灾难”问题一直困扰着其发展。虽然“维数灾难”问题是由待解决问题的本质所决定的,无法从根本上进......

学位

分层强化学习子目标抽象机制时序描沭逻辑自动分层算法

空天地网络中基于强化学习的通信计算与缓存技术研究

为了满足迸发的通信需求,实现未来6G“万物互联”的愿景,空基、天基与地基网络呈现出一体化的趋势。与传统的通信网络系统对比,在......

学位

空天地网络强化学习深度强化学习分层强化学习资源分配

基于强化学习的药品专利文本分析方法研究

近些年,在医疗体制改革政策的影响下,医药行业得到了迅猛发展,药品市场的需求不断地增长。制药企业作为国内医药行业的重要组成部......

学位

药品专利分层强化学习三步时间差分水溶解度结构相似性

基于分层强化学习算法的稀疏奖励问题研究

近年来随着人工智能领域的飞速发展,强化学习算法作为人工智能领域的经典算法受到了广泛的关注与研究。而稀疏奖励问题作为强化学......

学位

深度强化学习分层强化学习嵌套LSTM 自注意力模型

基于分层强化学习的MAUVS围捕策略研究

自主水下机器人(Autonomous Underwater Vehicle,AUV)可用来完成水下复杂而繁重的任务,是未来海洋勘测以及水下能源开发重要的工具......

学位

多水下机器人系统围捕分层强化学习任务分配行为预测

MAS中的自治协商模型优化研究

当今电子商务发展非常迅速，已经逐步形成了一个潜力巨大的市场。随着Internet上信息量和商务量爆炸式增长、网络环境日益复杂，以及产......

学位

Agent Q-学习分层强化学习自治协商模型僵局消解

分层强化学习研究及其在机械臂避障问题中的应用

分层强化学习在经典强化学习的MDP框架上引入抽象机制，从动作、任务和策略等角度对学习任务分解，构建分层机制，在抽象内部和抽象间的......

学位

分层强化学习自动分层子目标互信息冗余机械臂自主避障

一种基于PSO的分层策略搜索算法

针对分层策略梯度强化学习算法(HPGRL)易陷入局部最优点等问题,提出一种分层策略搜索算法(PSO-HPS).首先由设计者按照经典分层强化......

期刊

分层强化学习粒子群优化算法(PSO) 分层策略协商僵局

看过本文同时还关注