面向服务机器人的物体识别与行人检测特征学习方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:shenloa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动服务机器人工作时不仅需要识别周围的物体,而且也需要辨识环境中的运动的行人,因此,物体识别与行人检测是服务机器人领域中的两个重要的研究问题。特征提取与表达则是物体识别和行人检测技术系统中最为重要的部分。底层特征虽然计算速度快,原理直观,但是只从某一方面进行目标特征表达,辨识能力有限;多底层特征混合从多个不同侧面描述图像,提高了特征维度和计算复杂度,影响了实时性;近年来,随着海量数据越来越容易获得,以及计算机硬件技术的进步,采用深度学习从大量样本中学习得到层级特征的方法已在计算机视觉领域占据了统治地位,其中基于卷积神经网络的特征学习是最具代表的方法之一。卷积神经网络之所以取得优异的性能,主要得益于其将传统神经网络针对图像的二维拓扑结构进行重新设计,引入了卷积层、非线性处理层、池化层这一特殊结构。目前关于底层特征的研究在实时性要求高的场合仍很重要,另外卷积神经网络在取得优异性能的同时,也有计算负载大、训练过程复杂等问题存在。本文针对当前移动机器人视觉感知过程中物体识别与行人检测的特征表达问题,研究面向服务机器人的物体识别与行人检测特征学习方法,主要研究内容包括:  (1)提出了一种基于多尺度池化词袋编码的物体识别方法。首先,在详细分析SIFT特征基本原理的基础上,针对SIFT特征表达能力有限且运算速度过慢的问题,提出在多个尺度上池化局部特征主方向,得到MSP-SIFT特征;然后,采用K-means聚类算法将MSP-SIFT局部图像特征加以聚类,构建图像数据集的视觉词典,并用视觉词典对图像进行表达,得到图像的视觉单词频率直方图;最后,用SVM分类器进行分类。在多个图像数据集上进行实验,结果表明,相比采用SIFT特征进行物体识别的方法,多尺度池化词袋编码方法的识别率有显著提升,且在计算速度方面具有明显优势。  (2)提出了一种基于自相似卷积通道特征学习的行人检测方法。卷积神经网络(Convolutional Neural Network,CNN)由于其强大的层级特征提取能力,而受到越来越多行人检测领域研究人员的重视。然而,CNN存在计算负担过大的问题。对此,提出一种融合自相似特征与CNN卷积通道特征的行人检测方法,以在计算效率和性能之间进行权衡。首先,对输入图像同时进行两种操作:1)计算图像聚合通道(Aggregate Channel Features,ACF),并提取ACF通道之间的自相似特征;2)提取CNN的多层卷积特征图(零阶特征,作为卷积通道);然后,将自相似特征和卷积通道特征组成混合特征池,并利用多级级联AdaBoost进行特征筛选和分类器学习。在广泛采用的Caltech行人数据集进行实验,结果证明了所提出的方法的有效性。  (3)提出了一种基于视觉注意机制的BPCANet的快速行人检测方法。针对图像二维拓扑结构,CNN的卷积池化结构设计可获得多层图像特征表达,且高层特征包含更多语义信息,但是存在如下缺陷:1)需要复杂随机梯度下降算法进行参数学习;2)参数调整需要很大技巧;3)仅凭经验设计网络结构,没有清晰的数学推理证明等。针对上述问题,本文提出一种基于视觉注意机制的BPCANet的快速行人检测方法:首先,根据图像梯度范数特征确定可能存在物体的候选区域;然后利用PCANet网络对得到的候选区域框提取特征,其中使用PCA滤波器替代CNN中的卷积层;使用二值化哈希编码代替CNN中的非线性处理层;使用分块直方图代替CNN中的下采样层,将分块直方图特征作为整个PCANet网络最终的特征提取结果。最后,将分块直方图特征输入到SVM分类器对候选区域内是否含有行人进行分类。在INRIA,Caltech行人数据集上进行实验,结果表明,BPCANet在不明显损失性能的情况下,大幅提高了行人检测速度。  (4)面向机器人的物体识别与行人检测系统原型软件。为了更直观地验证本文所提出方法的有效性,采用MATLAB GUIDE工具对物体识别与行人检测系统原型软件进行设计与实现。该系统有物体识别、行人检测功能,主要包含三大模块:模型参数训练模块、模型测试模块以及识别结果显示模块。
其他文献
本文是在国家自然科学基金“基于耦合传感反馈的鱼游CPG的多模态控制”的支持下完成的。本文针对机器鱼的嵌入式视觉进行研究,实现仿机器鱼的视觉导航。   本文提出了一种
随着机器人应用领域的不断拓展,多机器人系统以其柔性、并行性及鲁棒性等特性受到普遍重视,围捕作为代表性的多机器人任务以其天然的动态性和对抗性成为研究热点。本文主要针对
两轮自平衡机器人是轮式移动机器人中重要的一类仿生系统。而桌面型两轮机器人不仅在体积、成本上具备优势,而且它可以实现在大型两轮机器人上无法实现的控制算法,具有广泛的应
机器学习作为智能信息处理的代表性方法在近几十年中取得了飞跃式的发展。然而经典的监督学习需要大量人工标记的数据作为训练样本;由于标记样本往往代价高昂,从而大大提高了监
定位与导航策略是实现移动机器人自主导航的关键问题。本文以运行于室内环境的轮式移动机器人为研究对象,对视觉自定位与未知环境下导航策略两个子问题展开深入研究。本文的
学位
十多年来,短信服务在世界各国电信市场中得到巨大的发展。而手机短信发送量的增长伴随而来的就是日趋泛滥的垃圾短信。词特征数量多,维数大,需要进行特征选择,否则会严重影响
随着世界各国对海洋的深入探寻,海洋勘测设备也由海上逐步向海下发展,根据海水环境的独特性质,水下设备应具有自主沉浮的能力,才能对海洋进行立体式探测。本文立足于中小型水下设
水下仿生游动机器具有机动性好、推进效率高等优点,应用前景广阔。而两侧波动鳍推进型仿生游动机器是一类典型的水下仿生游动机器系统。本文针对两侧波动鳍推进型仿生游动机器
磁共振无线供电技术,是一项近年刚出现的利用磁耦合谐振线圈之间的共振来实现电能以无线方式高效率传输的技术。相对于其它无线供电技术,磁共振无线供电技术具有中等距离上几乎