论文部分内容阅读
本文主要针对行人保护系统中基于移动视觉平台的行人检测和跟踪这些关键技术进行研究。行人保护系统力图在汽车等移动平台上建立一个自主、智能的行人检测、跟踪、辅助驾驶系统,具有提高驾驶安全性、保障行人生命安全的重要应用意义。另一方面行人保护系统的研究技术涉及到传感器技术、自动化与控制、人工智能、模式识别、信息融合等多个领域,是多学科交叉的一个研究热点,是相关领域良好的验证平台,具有很高的科学理论意义。
和一般的目标检测与跟踪问题相比,基于移动视觉平台的行人检测和跟踪因其动态应用场合的特殊性有其自身的特点,主要体现在:
1)算法应用环境的动态性;
2)应用范围的广泛性;
3)计算速度的实时性;
4)算法结构的精炼性。
针对这些问题和挑战,本文对移动视觉平台的行人检测和跟踪算法进行了深入的研究分析。
首先,本文从获取稳定本质特征的角度出发,对于行人检测问题,认为相关性(Context)特征是一类比较好的描述行人这种复杂非刚性物体的方式,进行改进并自己提出一种新特征;对于行人跟踪问题,认为运动连续性是跟踪问题的特点,基于流形学习的方法提出了运动连续性保持的本质特征。
其次,本文从建立特征模型的角度出发,对于行人检测问题,建立了最优层次结构分类器的模型,减少了分类计算的复杂度;对于行人跟踪问题,基于流形学习建立了行人的本质流形这样的生成模型,在本质低维空间实现了行人跟踪。
最后,本文从算法框架的角度出发,使用基于近邻搜索、贝叶斯理论等跟踪框架对算法有效性进行实验验证;同时提出了前景增强的预处理机制、双向映射机制等来增强算法的鲁棒性,使其适合多种应用环境。
本文的主要研究工作和贡献主要包括:
1)针对行人检测算法中目标、环境带来的稳定有效特征提取的困难,本文从相关性(Context)的角度出发,分析了行人复杂姿态的特点及相关的特征提取算法,改进了一种基于形状相关性(Shape-Context)的特征提取算法,使得算法复杂度更小而且适合Adaboost组合分类器的最优特征选择机制。将其和最优层次结构分类器组合,能够准确的进行行人检测与姿态鉴别。
2)针对行人检测算法中的Context特征提取算法计算复杂度高的问题,本文提出了一种新的Context特征提取算法——统计梯度相关性特征提取算法。该算法基于积分图像运算,能够满足实时性要求,同时能够对复杂多变的行人观测提取稳定有效的Context特征,并不受光照、多种姿态、复杂背景等影响,能够满足行人检测的鲁棒性要求。
3)针对行人跟踪问题中一般具体特征(颜色、纹理、梯度等)容易受目标时空变化的影响,本文基于流形学习理论提取行人目标的本质、低维的特征表示,构建了行人的本质变量连续性保持的低维流形子空间,基于此低维流形空问实现了鲁棒的动态行人跟踪。并进一步提出了一种自适应最优特征选择机制作为候选样本的预处理,增强样本前景区域的显著性,从而提高了算法的准确性。
4)针对基于流形学习的行人跟踪中的模板漂移、低维表示有误差等问题,本文从提出了一种双向映射机制将流形空间与图像观测空间紧密联系。该机制包括:一种新的从图像空间到流形空间的降维学习算法,特点是能够保持数据样本分布的邻域关系与全局拓扑结构,具有很好的本质变量连续性保持能力;一种从流形空间到图像空间的结构化非线性变形映射函数,特点是能够准确生成非训练样本点的图像观测表示,具有很好的泛化能力。本文进一步将这两个空间嵌入到贝叶斯框架下,实现了行人目标的准确跟踪和姿态估计。
这些算法在自有以及多种公共数据库进行测试,并基于实际的移动视觉平台进行实验验证,具有一定的实用性。
本论文工作得到了国家自然科学基金重点项目61033011“引入人的视-触觉认知及其融合实现机器人与人的仿人交互和合作”以及国家自然科学基金重大专项90820007“多种路况下基于车载平台的通用视觉感知模块技术研究”的支持,因此具有非常重要的应用和理论研究意义。