论文部分内容阅读
当前,机器人的应用已经扩展到军事行动、科学探索乃至医疗服务等各个方面,在这些室外环境中,往往没有完备的先验知识,因此机器人的环境认知功能就显得极为必要。图像分析是机器人认知环境的重要环节。而在图像分析技术中,图像的语义标注是图像理解的最常见的内容之一。由于卷积神经网络能够自动地提取图像的特征,在图像标注领域的作用越来越大。本文利用卷积神经网络来对预分割的超像素块进行特征提取,然后对得到的特征进行扩展和加权处理,最终建立条件随机场模型进行语义类别求解。 本文的主要研究工作包括: 1、利用ucm-gpb算法对图像作多尺度的超像素分割,通过超像素块最大内切圆圆心来确定输入图像块,并构建了一个13层的卷积神经网络来提取超像素层次的特征,得到多个分割层次下的超像素的特征向量。 2、对卷积神经网络得到的超像素特征进行扩展,并利用支持向量机对扩展之后的特征进行加权处理,得到加权之后的特征向量。 3、在像素层次上建立条件随机场模型,根据极大后验边际的思路进行模型推理。 4、在MSRC、Stanford Background和Sift Flow这3个公共数据集上进行了算法验证,并与当前经典的算法进行了比较,验证了本文提出的算法的有效性。