论文部分内容阅读
双目立体视觉在提取图像深度信息的问题上具有灵活性高、成本低并且易于实现的优点,所以在自动驾驶、机器人行走路线导航和机械臂实现工件的抓取等领域上得到了广泛的应用。双目立体视觉的核心就是在两个摄像头拍下的左右图像中,寻找到对应的匹配点,得到视差,进一步利用三角测量法来计算出图像的深度信息。近年来,卷积神经网络飞速发展,它在双目立体视觉中也得到了广泛的应用,基于深度学习的双目立体匹配算法逐渐成为现在双目立体视觉研究的一个新方向。本文针对端到端的卷积神经网络进行双目立体视觉算法的研究,主要研究在匹配过程中出现的由于遮挡区域、反射、弱纹理和重复纹理区域导所带来的误差问题,提升最后的匹配精度。为了提升匹配精度,我们主要从如下两个方面进行了研究:(1)提出了基于空洞空间金字塔池化的立体匹配算法。我们设计了一个端到端的立体匹配算法,算法最核心的模块是一个空洞空间金字塔池化结构。空洞空间金字塔池化结构的设计有效的提取了图像的多尺度语义信息,在特征提取模块中有效的提升了立体匹配算法的精度,并且空洞卷积的存在省去了特征提取阶段费时的双线性插值算法,有效的提升了网络处理图像对的速度。(2)提出了基于密集连接网络的立体匹配算法。算法的核心是密集连接网络结构。密集连接网络通过密集连接加强特征的传递,连接每一个密集连接块的输入输出层,融合多层特征信息,实验表明此算法可以进一步的提升匹配精度。我们在KITTI Stereo数据集上进行了实验分析,结果表明我们提出的立体匹配算法有效的提升了视差估计的精度,并且提升了网络训练的速度。