论文部分内容阅读
为了使机械臂抓取几何结构未知的物体,以及在物体位置变化时自主规划运动路径,本文利用图像深度信息和卷积神经网络实现机械臂预测最佳抓取位姿,运用深度强化学习算法实现机械臂自主执行抓取操作。对于预测最佳抓取位姿的任务,本文在网络深度、卷积核大小等方面对生成抓取卷积神经网络进行改进。使用来自Jacquard抓取检测数据集中的样本训练并测试改进的神经网络。抽取Jacquard数据集中的样本组成验证集来验证网络泛化性能,取得了最高87.5%的预测准确率。配有深度相机的六自由度仿真机械臂搭载泛化性能较好的网络模型,在机器人操作系统中进行抓取物体的实验。对于静态的物体使用开环抓取的方式,对于动态移动的物体运用视觉伺服进行闭环控制抓取。各个实验最终在测试集上均取得了超过80%的抓取准确率。对于机械臂自主控制末端到达目标区域的任务,构造二维仿真机械臂,运用深度确定性策略梯度算法训练机械臂自主完成任务。针对奖励函数和回放经验采样策略两方面对算法体系做出改进,并通过仿真实验进行对比。实验结果显示,两种改进方式都可以提高机械臂在执行任务时的收敛速度和稳定性。为实现机械臂自主抓取物块,在机器人操作系统中搭建三维仿真机械臂。将深度强化学习算法的改进方案迁移到其中,通过实验对比显示,改进方案有利于深度强化学习算法训练机械臂提高抓取物块的成功率。