【摘 要】
:
针对水而无人艇(USV)在复杂海洋环境下执行任务时需要用户进行干预的问题,本文提出了基于逆向强化学习的行为模仿学习方法.该方法将专家的示教作为学习目标,使得USV能够从专家示教中学习导航行为.首先根据导航任务的应用背景,建立了向专家行为模仿学习的Markov决策模型,然后给出了适用于USV导航行为学习的行为模仿学习算法,该方法基于逆向强化学习根据专家的示教行为计算出具体的回报函数,并得到接近专家策
【机 构】
:
大连民族大学机电工程学院,大连市116600 中国科学院沈阳自动化研究所,沈阳市110016
论文部分内容阅读
针对水而无人艇(USV)在复杂海洋环境下执行任务时需要用户进行干预的问题,本文提出了基于逆向强化学习的行为模仿学习方法.该方法将专家的示教作为学习目标,使得USV能够从专家示教中学习导航行为.首先根据导航任务的应用背景,建立了向专家行为模仿学习的Markov决策模型,然后给出了适用于USV导航行为学习的行为模仿学习算法,该方法基于逆向强化学习根据专家的示教行为计算出具体的回报函数,并得到接近专家策略的最优导航策略.最后经过仿真实验验证,本文所提出的方法能够使USV从专家示教中学习到恰当的导航行为,并从专家示教中获得用户偏好,验证了本方法的有效性.
其他文献
针对临床缺少多位姿康复训练设备的现状,研制了一种新型多位姿康复机器人,该机器人能够满足偏瘫患者在卧、坐、站等不同位姿下进行康复训练.本文首先介绍了机器人各部分组成及机构设计方案,通过多位姿座椅、脚踏式训练机及运动底座的有机结合,实现了多种位姿的转换与训练轨迹的规划.其次,在矢状面内建立人-机模型,对其运动学、工作空间进行分析.最后,通过样机试验验证了该机器人工程实践的可行性.
在下肢康复训练时需有效感知患者的运动和生理信息,本课题研制了一款而向下肢康复训练的人体多源信息感知系统.该系统采用cRIO嵌入式平台采集肌电、关节角度、足底压力以及脉搏信号;传感器均设计为模拟输出方式,可实现信号的同步采集.设计上位机实现了信号处理、信号可视化以及数据存储等功能.试验标定了足底压力、关节角度传感器的线性度;测量了肌电传感器的输出噪声幅值,并通过监测某志愿者康复训练状态验证了系统的有
为提高偏瘫患者健、忠侧肢体协调运动能力,研制了一种新型坐式单驱动四肢联动康复机器人,它能够在主被动模式下为偏瘫患者的肢体提供同异步协同训练.基于平面七连杆变胞机构设计了一种可实现四肢协调运动的训练机构,通过传动系统调节两侧训练机构曲柄的相位差,实现左右两侧肢体同步或异步联合运动;在矢状面内建立人-机模型及训练机构进行运动学分析,从理论上证明该机构能够实现四肢联动的可行性;最后在样机上进行了试验,试
受生物水母自由灵活运动的特点以及独特的喷射推进模式的启发,研制开发了基于多连杆推进机构与重心调节机构的新型仿生机器水母.通过对强化学习基础理论与机器水母实际系统进行对比与结合,提出了应用于机器水母的强化学习姿态控制算法.水下复合运动实验的成功表明了所提姿态控制算法的有效性.机器水母最终获得了5.6°/s的转弯偏航角速度和3.6°/s俯仰角速度.
多像机组网网络设计具有多参数、多约束、运算最大等特点,在理论上是一个复杂的优化策略问题,寻找它的绝对精确最优解通常需要非常大的运算量,因此在实现时必须考虑算法的效能.本文利用基于粗糙集的启发式属性约简算法获得特征属性的约简,在此基础上,再利用改进的支持向量机对约简信息进行预测.为了获得最优的预测精度,同时,采用混沌粒子群优化(PSO)防止SVM的预测模型的局部优化,可以使预测率显著提高.分析结果表
核环境自动化维护至关重要,需要研制一种可以替代人类进入核聚变反应舱内完成探测和维护作业的机器人,并使其具有大范围高精度遥操作性能.本文以EAST核聚变舱的探测和维护作业为例,设计了一种具有蛇形多关节结构的遥操纵机器人系统,结构上采用轨道推送加悬臂调整的复合式操控方案.针对机器人执行全舱作业的运动需求,对机械臂运动轨迹进行了仿真分析.此外,设计了包括路径规划与轨迹控制等在内的机器人运动控制算法,构建
本文提出了一种基于改进增量平滑的SLAM后端优化算法,用以提高SLAM问题中的状态估计精度.首先,为了减少线性化带来的误差,本文采用无迹变换及数值微分理论来求解SLAM问题中的Jacobian矩阵,从而提高其求解精度;其次,将上述求解的Jacobian矩阵引入基于增量平滑的SLAM框架中,进行后端优化更新,以提高整个SLAM系统中的状态估计精度;再次,为了验证所提出算法的性能,本文通过仿真实验与平
为了监测EAST核聚变试验装置的日常运转状况,代替人类进入舱内完成探测作业任务,设计一种具有蛇形多关节结构的遥操纵机器人系统.该系统由前端的双重观测机构、中部的多个悬空机械臂和后端的直线轨道推进装置组成.通过对系统各部分的结构设计及功能分析,确立了组合式悬空机械臂各关节的主要参数指标.对机器人系统的探测工作空间以及机械臂的运动和力学特性进行了仿真分析.实际构建了机器人原理样机以及核聚变舱的模拟几何
提出一种基于高斯混合模型与地球移动距离的点集配准算法.将待配准的两个点集均表示为高斯混合模型,其中高斯分布的数量为点集中点的数量,每个高斯分布的均值为点的坐标值,方差为通过优化算法得到的优化值.在配准过程中通过优化两个高斯模型之间的地球移动距离来达到最佳匹配效果.该方法对点集配准中常见的噪声,外点,结构缺失等问题具有较强的鲁棒性.公共数据集与真实车辆平台上的实验表明该算法优于目前流行的点集配准算法
石化工厂有毒气体发生泄露将会危害到一线生产工作人员的生命安全,并给企业带来重大经济损失.有毒气体作为一种特殊连续目标物体,由于其不可见性和易扩散性,现有的一些方法尚不能准确检测和可视化泄露危险区域.本文基于无线传感器网络提出一种检测有毒气体泄露危险区域检测算法,通过确定有毒气体扩散边界区域来检测危险区域.为了更好地计算出危险区域面积,本文引入平面邻近图方法,把复杂的网络图分割成清晰可见的不规则区域