奖励函数相关论文
移动机器人穿越动态密集人群时,由于对环境信息理解不充分,导致机器人导航效率低且泛化能力弱。针对这一问题,提出了一种双重注意深度......
针对现有的路径规划算法效率低的问题,根据奖励函数和多层感知机提出一种基于深度强化学习的路径规划算法。考虑到环境的复杂程度,为......
近些年来,机械臂随着工业化的发展已经逐渐在人们的日常生活中得到广泛应用,但同时对机械臂的工作环境、工作任务等要求也高了不少......
自动驾驶技术一直是人工智能领域研究的热点之一。传统模块化方法受限于驾驶环境的复杂,难以做出系统性设计;基于监督学习的深度神......
随着车辆智能化程度的提高,自动泊车技术逐渐成为研究热点。目前,由于泊车环境恶劣、驾驶员经验不足,导致狭小空间内泊车困难,因此......
针对中小型规模水下无线传感器网络中存在的节点能量消耗不均衡、网络生命周期较短的问题,提出一种基于强化学习(RL)与消息反馈机......
关于移动机器人的研究始终绕不开导航控制,目前有很多优秀的算法应用于机器人导航,取得了众多成果,但这些算法大多依赖环境地图或......
中国高速公路里程已经突破14万公里,稳居世界第一,但与此同时交通事故率也高居不下。合流区的交通环境复杂,易出事故,是高速公路车......
针对蒸汽发生器精确建模困难和低工况下控制性能差的问题,本文提出了一种基于深度强化学习优化的智能分层(IH)控制器.使用串级PI控......
自动驾驶是车辆工程技术发展的重大变革,其在有效提高道路安全性的同时,对于缓解交通拥堵、减少环境污染具有重要作用。从自动驾驶......
近年来,随着深度学习算法的不断更新改进与计算机硬件设备计算能力的提高,聊天机器人的研究也取得了很大的进展和突破。生成式的聊......
核物理技术推动了当代国防和能源技术的快速发展,但核废料的不当处理导致放射性元素泄露而造成环境污染、癌症诱发等问题。质子直......

