奖励函数相关硕士博士期刊学术论文

奖励函数相关论文

基于深度强化学习的机器人导航算法研究

移动机器人穿越动态密集人群时，由于对环境信息理解不充分，导致机器人导航效率低且泛化能力弱。针对这一问题，提出了一种双重注意深度......

期刊

深度强化学习奖励函数状态价值网络双重注意力

基于深度强化学习的路径规划算法研究

针对现有的路径规划算法效率低的问题，根据奖励函数和多层感知机提出一种基于深度强化学习的路径规划算法。考虑到环境的复杂程度，为......

期刊

路径规划深度Q网络多层感知机奖励函数动作选择

基于深度强化学习的机械臂路径规划研究

近些年来,机械臂随着工业化的发展已经逐渐在人们的日常生活中得到广泛应用,但同时对机械臂的工作环境、工作任务等要求也高了不少......

学位

深度强化学习机械臂路径规划旋量法奖励函数

基于深度强化学习的自动驾驶系统设计与实现

自动驾驶技术一直是人工智能领域研究的热点之一。传统模块化方法受限于驾驶环境的复杂,难以做出系统性设计;基于监督学习的深度神......

学位

自动驾驶深度强化学习异构融合特征 DDPG 概率图模型奖励函数

基于强化学习的泊车轨迹规划研究

随着车辆智能化程度的提高,自动泊车技术逐渐成为研究热点。目前,由于泊车环境恶劣、驾驶员经验不足,导致狭小空间内泊车困难,因此......

学位

强化学习轨迹规划奖励函数实车测试

基于消息反馈与强化学习的节能路由算法

针对中小型规模水下无线传感器网络中存在的节点能量消耗不均衡、网络生命周期较短的问题,提出一种基于强化学习(RL)与消息反馈机......

期刊

水下传感器网络强化学习能量有效奖励函数反馈消息路由效率空洞节点网络生命周期

基于强化学习未知环境下的机器人导算法

关于移动机器人的研究始终绕不开导航控制,目前有很多优秀的算法应用于机器人导航,取得了众多成果,但这些算法大多依赖环境地图或......

学位

移动机器人端到端导航算法深度强化学习探索策略奖励函数

基于深度强化学习的智能车高速公路合流区换道决策研究

中国高速公路里程已经突破14万公里,稳居世界第一,但与此同时交通事故率也高居不下。合流区的交通环境复杂,易出事故,是高速公路车......

学位

智能驾驶汽车合流区换道深度强化学习奖励函数决策

基于深度强化学习的蒸汽发生器水位控制

针对蒸汽发生器精确建模困难和低工况下控制性能差的问题,本文提出了一种基于深度强化学习优化的智能分层(IH)控制器.使用串级PI控......

期刊

蒸汽发生器深度强化学习深度确定性策略梯度水位控制状态信息奖励函数评价网络动作网络

基于区块链的线上教育管理系统的设计与实现

互联网+模式的飞速发展,为线上教育聚集更多优质资源提供了便利条件,使其摆脱了时间和空间的束缚。近年来,尤其是新冠疫情以来,相......

学位

区块链共识机制奖励函数自私挖矿马尔科夫决策过程

基于深度强化学习的车辆自动驾驶拟人决策

自动驾驶是车辆工程技术发展的重大变革,其在有效提高道路安全性的同时,对于缓解交通拥堵、减少环境污染具有重要作用。从自动驾驶......

学位

自动驾驶拟人决策深度强化学习驾驶风格奖励函数

基于强化学习的情感对话回复生成算法研究

近年来,随着深度学习算法的不断更新改进与计算机硬件设备计算能力的提高,聊天机器人的研究也取得了很大的进展和突破。生成式的聊......

学位

对话生成情感对话强化学习奖励函数安全回复

基于深度强化学习的束流偏移校准研究

核物理技术推动了当代国防和能源技术的快速发展,但核废料的不当处理导致放射性元素泄露而造成环境污染、癌症诱发等问题。质子直......

学位

束流偏移校准中等能量传输线深度强化学习奖励函数

基于强化学习的认知无线电网络频谱分配方法研究

随着移动互联网的快速发展和智能终端技术的不断更新,无线移动用户的数量在过去几年中不断增加。预计这种趋势将在未来几年内会一......

学位

认知无线电网络 Q学习动态频谱接入奖励函数博弈论

看过本文同时还关注