【摘 要】
:
传统机械臂控制方法按照人为预设固定轨迹来对其进行控制,完成特定的任务,依赖于精确的环境模型,并且控制过程缺乏一定的自适应性.为解决该问题,提出一种自主视觉感知与强化学习相结合的端到端机械臂智能控制方法.该方法中视觉感知使用YOLO算法,策略控制模块使用DDP G强化学习算法,使机械臂能够在复杂的环境中学习到自主控制策略,并且在训练过程使用了模仿学习与后视经验重播,加速了机械臂的学习过程.实验结果表明算法能够在更短的时间内收敛,并且在仿真环境中自主感知目标位置及整体策略控制都有着出色的表现.
【机 构】
:
湖北文理学院 计算机工程学院,湖北 襄阳 441053;西北工业大学 计算机学院,陕西 西安 710129
论文部分内容阅读
传统机械臂控制方法按照人为预设固定轨迹来对其进行控制,完成特定的任务,依赖于精确的环境模型,并且控制过程缺乏一定的自适应性.为解决该问题,提出一种自主视觉感知与强化学习相结合的端到端机械臂智能控制方法.该方法中视觉感知使用YOLO算法,策略控制模块使用DDP G强化学习算法,使机械臂能够在复杂的环境中学习到自主控制策略,并且在训练过程使用了模仿学习与后视经验重播,加速了机械臂的学习过程.实验结果表明算法能够在更短的时间内收敛,并且在仿真环境中自主感知目标位置及整体策略控制都有着出色的表现.
其他文献
RippleNet对用户偏好传播进行建模,并运用在推荐系统中,取得了良好的效果,但RippleNet没有考虑知识图谱中的实体权重,导致推荐的实体不够精确.提出了一种加入复杂网络节点影响力的Cn?RippleNet模型,在构建基于知识图谱的复杂网络之后,抽取其最大子网模型,计算图谱网络中节点影响力,并将其作为实体的权重添加至图谱实体中,最终计算出推荐结果.实验结果表明,该方法将RippleNet的AUC和ACC的值提高到了93.0%和85.6%,弥补了RippleNet没有考虑图谱实体影响力的问题,使推荐结
随着移动应用功能日趋复杂,众包测试对测试人员的专业技能提出更高要求.因此,如何高效匹配测试任务需求与测试人员技能水平,实现精准的众包测试任务推荐是保证测试质量的重要因素.提出一种基于深度学习的移动应用众包测试任务推荐算法.针对测试任务和测试人员进行特征分析,分别设计特征体系;将得到的特征数据作为堆叠式边缘降噪自动编码器(stacked marginalized denoising autoencoder,SMDA)输入数据,将SMDA学习到的深层特征数据结合作为深度神经网络(deep neural net
自由漂浮空间机器人(free?floating space robot,FFSR)是进行在轨服务的重要工具,其基座姿态和关节角间存在复杂的一阶微分约束关系,进行运动规划时需直接考虑微分约束,这让其运动规划问题充满挑战.“先求逆运动学,再规划轨迹”的运动规划框架,存在目标构型与初始构型未必在同一连通域的隐患,为克服这一隐患,基于有目标偏置的RRT(GB?RRT)研究了FFSR从初始构型到目标末端位姿的运动规划问题.对于算法中的目标末端位姿导引生长,考虑到因FFSR执行机构自由度不足,而导致的末端位姿误差收敛
在桥梁拆除中,拱桥相比其他桥型更容易发生失稳破坏,施工存在很大难度和安全风险.文章结合拆桥工程实例,阐述大跨度双曲拱桥上部孔跨结构拆除的技术方法,通过选择合理的方案,既实现高效、安全的施工需要,又有效降低对周边环境的影响,节省工程费用.以期为类似工程提供参考.
轨道结构在列车荷载的长期影响下会发生变形或状态恶化.通过准确把握轨道结构的薄弱点并采取措施,能够更高效地对其进行养护,确保其安全性.文章介绍轨道结构常见的薄弱点及其特征,并提出相应的检测及养护维修措施,以期提高轨道结构的安全性和养护维修效率.
纤维增强树脂基复合材料具有比模量比强度高、耐冲击、抗蠕变、抗震等特点,在航空、汽车、海洋工业中得到广泛的应用.纤维铺放作为先进复合材料成型技术之一,能够高效率、高质量、高重复性和低成本加工大曲率复合材料零件.橡胶压辊在压力作用下会产生变形,从而增加压辊与基底接触的面积,并进一步改善层间结合度.由于不同铺放压力会导致压辊产生不同的变形量,针对纤维铺放压辊变形过程进行分析,通过建立压辊压应力分布模型,获得接触压应力、压辊下压量以及压辊与基底的变形接触区域之间的映射关系,并通过实验验证了该模型的有效性.
欧洲数字化自动车钩(DAC)项目是一个由德国联邦运输和数字基础设施部资助、由DAC4EU财团承担的项目,其将对不同品牌的4种DAC样件进行测试,以从中选出一种可在整个欧洲推广使用的产品,推动DAC相关技术方案的部署.各DAC样件都将经过标准化测试程序,包括机械、电气以及数据通信测试.文章将介绍其中的机械测试.
某脱盐水装置采用离子交换除盐工艺制取精制脱盐水时,混床交换器存在再生周期短、再生酸碱消耗量高和再生废水量多等问题.为降低再生酸碱耗量、减少再生废水排放量,该脱盐水装置采取了一系列改进措施将混床交换器周期制水量由5万t/a延长至6万t/a,不仅达到了预期的降耗减排效果,同时给装置节省了运行维护费用.
随着全国轨道交通快速发展,上海市轨道交通已进入超大规模网络时代.为应对庞大的轨道交通网络所带来的超负荷运维工作,上海市轨道交通以智能运维平台为核心,设施设备统型推进,各专业平台集群建设,构建运维平台化体系,采取轨道交通全专业信息链的超大规模网络轨道交通运维平台管理模式(即“三台”管理模式),最终实现覆盖全网,智能化、浸入式、扁平化的设备管理方式.
水下探测通信一体化利用通信发射信号进行目标主动探测,而多普勒效应的存在使得主动探测中目标参数估计性能恶化.为了消除多普勒效应的影响,提出一种基于频谱细化与校正的联合多普勒估计和补偿方法.该方法利用通信发射信号中的同步头信号获取目标回波信号时延,截取信号中的单频信号段.再利用离散傅里叶变换(DFT)求得单频信号段最大幅值所对应的频率,并在该频率附近范围内进行频谱细化与校正求出频率偏移量,从而估计出多普勒因子,并根据所估计的多普勒因子对接收的目标回波信号进行补偿.仿真结果表明,所提的频谱细化与校正联合多普勒估