策略梯度相关论文
随着电动汽车的应用推广,换电站的调度优化逐渐成为研究热点。传统的基于换电需求预测值的调度策略在实际应用中面临着难以适应动态......
深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习......
强化学习是一种人工智能算法,具有计算逻辑清晰、模型易扩展的优点,可以在较少甚至没有先验信息的前提下,通过和环境交互并最大化值函......
随着人工智能技术的发展,连续机器人控制在实际应用中的重要性日益增加,受到学术界及工业界的广泛关注。然而,连续机器人控制任务......
图像描述生成是计算机视觉与自然语言处理的交叉任务,该任务的完成需建立在图像理解与抽象推理的基础上,巨大的挑战吸引了越来越多......
裂缝是沥青路面的常见病害,影响行车的安全性和舒适性。及时地发现和修补裂缝可以保证路面的长期使用性能,并能节省维修预算。因此......
强化学习是机器学习领域的一个重要分支,它通过模拟生命体大脑的学习思维模式来学习行动策略。与传统的学习方法不同,强化学习中的......
人工智能技术近年来迅猛发展,可以轻松提取出自然数据中的特征和内在联系,非常擅长拟合高度非线性关系。因此,人工智能技术被广泛地应......
随着计算机网络技术的发展和进步,以及服务带宽的不断提高,人们对视频媒体业务的需求也在日益增加,网络视频服务正处于高速发展阶......
学习控制是强化学习中的主要任务之一。该任务的目标是获取最大化期望回报的策略。近年来,许多用于求解连续动作空间的策略梯度算......
水文流量预测技术是一种在水文环境领域,利用水文环境中的气候等特点,实现对河流中的流量预测。其中,GWLF技术的使用非常广泛,这种......
随着大数据的到来,网络用户的规模呈现爆发式增长。面对海量繁杂的网络大数据与千差万别的网络用户,如何从海量数据中精准的推荐给......
近年来,随着四旋翼无人机(简称四旋翼)在航拍、资源勘探、农作物保护等领域的广泛应用,业界对其控制性能和智能化程度的要求也越来......
学位
随着工业现代化进程的快速推进,我国的制造业发展也迈上了新的台阶,工业机器人是当今制造业的重要组成部分,被应用于各种各样的生......
近些年来,作为机器学习领域的重要组成部分之一,强化学习的研究工作取得了极大进展。通过强化学习机理,智能体可以不断学习和得到......
经过漫长的自然选择,四足哺乳动物逐渐进化出能适应复杂环境的肢体。而人类制造的普通履带式、轮式汽车或者机器人却很难在复杂的......

