论文部分内容阅读
双目立体视觉是计算机视觉领域中研究的热点之一,具有重要的理论研究意义和实际应用价值。双目立体视觉的基本原理是模仿人类双眼的视觉感知过程,从两个不同的视点观察同一个物体,通过三角测量法恢复图像的三维信息。 本文研究的目的是基于直线段特征,实现目标物体的三维结构重建。其主要内容包括对立体图像对的特征直线段提取与匹配,摄像机标定以及三维结构重建。而本文主要针对直线段的匹配与物体三维结构重建两部分内容展开深入的研究与分析。主要工作如下: (1)为了计算物体的深度信息,需要有拍摄物体摄像机的内部参数。通过研究现有常用的标定方法,本文采用精度较高、操作简便的张正友标定法来实现摄像机的标定。 (2)直线特征大量存在于工业物体等场景中,准确实现直线段提取与匹配是三维重建等应用领域的关键。通过用Canny边缘检测对图像进行预处理后,选取了改进的Hough变换准确提取直线段参数、端点及长度等信息。在构建直线段灰度描述子时,提出用高斯函数对直线段平行域内的平行线进行加权处理,避免了人工设置加权系数,同时也提高了直线段的匹配精度。在直线段立体匹配方面,提出了一种基于极线约束与直线特征描述子相结合的直线段立体匹配方法。首先采用极线约束缩小搜索区域;然后应用几何特征描述子描述直线段的几何特征,并进行粗匹配;最后将直线段灰度描述子和几何描述子组合成一个特征向量,用向量间欧氏距离实现精确匹配。实验结果表明该匹配方法是一种准确有效的直线段立体匹配方法。 (3)在双目立体视觉中,本文用左右图像中直线段特征实现物体的三维结构重建。首先,用Plücker坐标表示3D直线;然后用重投影几何误差作为线特征三角法和光束平差法的目标函数,确保算法的最大似然估计;最后用线性和非线性两种方法分别实现对空间直线的迭代求解。在重投影时,本文考虑了每条直线投影时的尺度因子l,并给出了计算l的数学公式。真实图像和仿真数据验证了该方法是准确有效的。 通过本文的研究,初步实现了双目立体视觉中特征直线段的立体匹配和物体的三维结构重建。