论文部分内容阅读
人体检测是计算机视觉与模式识别领域中的研究热点,具有较强的理论意义及较大的应用价值,受到国内外研究人员的广泛关注。图像传感器捕捉到的人体目标具有一定的姿态与视角变化,在噪杂背景中呈现复杂的模式,这使得人体检测成为目标检测方向中的一个难题。
要使计算机能够自动地识别或检测人体目标,需要赋予它透过图像内容的变化区分人体目标的本质特征与非本质特征的能力。本文首先提出一种基于1范数最小化学习(Ll-norm minimization learning,LML)的优化模型,然后在此基础上提出一种线性分类算法(Linear LML,L-LML)。该算法利用1范数的稀疏性,从VC维最小化的角度构建线性分类器同时实现特征选择。在分类器构建过程中,L-LML算法通过对分类器的法向量建立1范数最小化约束模型,然后根据训练样本的特征分布计算分类器的阈值,从而完成线性分类器的学习。由于法向量的稀疏性,对特征向量实施法向量加权,突出了特征向量各元素之间的差异性,实现了特征向量的稀疏表示,达到了特征选择的目的。
考虑到样本分布的复杂性及非线性可分等特点,本文在LML优化模型的基础上,提出了一种基于1范数最小化学习的非线性学习算法(Non-linear LML,NL-LML)。该算法首先对样本实施一种由核函数诱导的非线性变换,将样本映射到高维空间,并对样本重新进行表示,然后利用LML模型对变换样本进行训练。这种由核函数诱导的非线性变化简单有效,与LML优化模型结合可以实现非线性分类。NL-LML也可以实现特征的稀疏表示。不过与上述L-LML不同,此过程是在变换特征空间而非原空间进行的。
为实现图像块状特征的选择及提高目标检测效率,本文基于LML优化模型设计了一种级联分类器(Cascaded LML,CLML)。该分类器中的每一级为多个弱分类器加权投票组合构成的强分类器。每一个弱分类器对应一个图像块状特征,对弱分类器的选择即是对特征块的选择。弱分类器的法向量和阈值分别通过LML优化模型和min-max罚函数模型训练得到。在强分类器的构建过程中,本文提出使用整数规划模型,从全局最优化的角度确定有投票权的弱分类器,从而实现弱分类器的最优组合方式。
本文使用梯度方向直方图特征(HOG)及变尺度梯度方向直方图特征(v-HOG)表示人体目标,所提到的所有算法均在公开的人体测试集INRIA与SDL上进行了验证。