基于单目视觉的物体位姿估计方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:pig2540840
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着工业自动化设备及机器视觉技术的发展,三维物体的识别及位姿估计变得尤为重要。尤其在工业自动化装备和分拣机器人应用方面,如何确定物体的三维位姿成为研究的重点。在国内的工业制造中,多数自动化设备或机器人只能在固定深度情况下完成简单物体的定位识别,如圆、正方形等。在某些复杂物件的车间甚至还需要人工参与物体分拣,这是一个重复而又耗时的环节。随着机器视觉技术的发展和工业生产需求的提高,人们对物体的三维位姿估计提出了更高的要求。本文针对物体识别及其位姿估计的问题,提出了基于单目视觉的目标物体识别和位姿估计方法,实现了仅输入目标物体的图像和目标物体几何模型就能识别物体并确定其位姿,该方法有效的克服了深度问题,使该方法能运用于三维物体的识别和位姿估计。与传统方法相比,本文从目标物体建模和目标物体识别两个方面进行改进。对于目标物体建模,本文提出了一种直接利用物体CAD模型特征训练生成目标物体的3D模型的方法。该方法首先进行相机标定求取相机的内参和畸变系数,结合刚体运动原理获取投影矩阵。将CAD模型的数据经过虚拟相机进行投影变换以及对物体不可见部分进行消影后获取消影投影后的二维特征,对二维的特征进行训练并结合网格层次聚类以及图像金字塔原理建立目标物体的3D模型。对于目标物体识别和位姿估计,本文将识别过程转化为边缘点在受力下产生的位移过程,对该过程建立目标误差函数,进而将识别问题转化为求解目标函数误差最小的问题。在二维图像上,提取目标物体的轮廓及梯度特征,并将其与3D模型进行匹配,求解目标物体的位姿。为加快速度,本文提出了将图像金字塔和网格层次聚类相结合的搜索匹配策略,匹配首先发生在金字塔和3D模型网格聚类的顶层,确定初始位姿后,依次向金字塔和网格下一层搜索,整个搜索过程是由粗搜索到精确搜索的过程,最终识别目标物体及其位姿。该方法在Windows平台上利用Visual studio 2013基于Open CV、Open GL进行软件实现。本文采用了多幅仿真图像及部分测试图像对本文的方法进行验证,实验表明,本文的方法能正确的识别目标物体及其位姿,并对旋转、遮挡、缩放具有一定鲁棒性。
其他文献
<正> 阿拉伯音乐在进入伊斯兰时期之前,几乎没有什么理论可言,可是,一进入伊斯兰时期,阿拉伯人立即对音乐理论发生了浓厚的兴趣。从公元7世纪末的伊本·米斯贾赫开始,就非常
提出假设高校社团能够促进由自主学习能力、自我管理能力、自我评价能力和沟通能力构成的大学生自我教育能力的发展,并据此在番禺职业技术学院做了实证案例研究。从研究结果
教材中兼类词的标注在理论和实践上都是一个值得探讨的问题,目前的教材在这方面存在一些瑕疵。兼类词是一类特殊的聚合,要正确的定义和确定兼类词,必须把兼类词同词的多功能
1江苏省体育场馆发展现状体育设施既是体育事业发展的基本条件,也是体育产业发展的重要基础,同时也是经济和社会水平发展的重要标志。近年来,江苏省对市区的体育场馆进行建设和
手机短信息方便、快捷、经济、准确的优点,使其应用日趋广泛。医院信息系统要实现全面数字化,也需要与短信应用相结合。在实践医院门诊系统与短信平台结合的前提下,探讨了主
通过对中国传统春节文化元素的挖掘、分析,探究如何把这些元素应用于酒礼品包装设计之中,以及这种方法论对现代包装设计的意义及其启示。
探讨定位包覆竹节纱的纺纱工艺,并对其针织物布面效果进行分析。利用新型多功能多电机电脑控制器对三罗拉花式捻线机进行控制,通过对竹节纱的包绕进行设计,在没有检测装置的
淀粉是生活中常见的物质,是食物的重要组成成分。本文用土豆、山芋、藕、浓米汤、浓面汤等作为淀粉的来源,探究了催化剂、温度等条件对淀粉水解结果的影响,既培养了学生的探