论文部分内容阅读
三维物体检测与位姿估计是机器人感知环境的基础,它赋予机器人一定的“智能”,在无人干扰的情况下实现物体上下料、装配、搬运等任务。然而,当机器人处在非结构环境下时,同种或不同种物体之间的无序交错堆叠、相互遮挡,给物体检测和位姿估计带来了非常大的困难。因此,本课题研究一种三维物体检测、位姿估计与抓取的方法,可使机器人在上述复杂的情况下仍能完成任务,并针对钢板抓取这一实际应用展开研究。本文的主要工作包括以下几个方面:1)针对SSD网络中小物体检测性能的缺失,提出了一种改进特征融合的SSD物体检测算法,有效的提升了小物体的检测性能。文章通过使用反卷积将具有强语义信息的高层特征添加到低层特征层中,并结合跳跃连接加速网络训练,提升物体检测能力;且在各特征层融合处,利用神经网络自动学习的特点,提出自适应加权连接。2)为降低模板匹配中的重复识别和误识别结果,提出了一种目标物体感兴趣区域的模板匹配算法。本文利用改进的SSD获取物体的感兴趣区域,且只在感兴趣区域内使用模板匹配,实现了物体误识别率的降低。为进一步去除物体局部误识别,通过改进模板聚类的方法,提出了一种基于相似空间位置的模板聚类方法。3)针对三维物体表面具有的平面特征,根据需求不同,提出了两种不同的位姿估计方法。一种是根据平面特征设计的粗糙位姿估计方法,可满足快速但精度不高的抓取需求;另一种是利用模板匹配的精细位姿估计方法,该方法适用于平面物体或三维物体。此外,利用位姿验证策略,可进一步剔除位姿估计不准确的结果。4)针对相机精度,视野范围等问题,提出了二次检测、二次位姿估计的方法。第一次检测、粗糙估计物体的位姿,目的是使机器人末端移动到物体的正上方,达到相机生成点云误差最小的目的。第二次检测、精细估计物体的位姿,目的是使估计的物体位姿误差最小。5)以深度相机、彩色相机、磁霸末端和UR3/5机器人构建硬件平台,以ROS系统、TensorFlow神经网络库、Opencv图像处理库、PCL点云处理库和MoveIt运动规划库构建软件框架。在物体混乱堆叠的抓取实验场景中,验证了整个系统的有效性和可行性。