论文部分内容阅读
视觉目标检测与跟踪是计算机视觉领域的重要研究课题,在智能监控、视频压缩编码、人机交互和增强现实等领域有着重要作用。近年来,Boosting算法凭借坚实的理论基础和良好的泛化性能在视觉目标检测与跟踪研究中得到了越来越广泛的关注,并被成功应用于解决实际问题。然而,随着计算机视觉领域对Boosting算法研究的深入,其在在线学习、不平衡学习和半监督学习等问题上的不足日益凸显出来。论文对Boosting算法及相关理论进行了深入研究,尝试从理论角度解决这些问题,并为其在目标检测与跟踪中的应用提供理论和技术支持。论文主要贡献如下: (1)针对在线学习问题提出了可分性最大化Boosting算法。通过分析指数损失Boosting算法的样本间隔分布,给出了样本可分性的定义。可分性通过平均样本间隔与间隔方差计算,处理在线学习问题时可增量估计。并证明该算法严格等价于批量AdaBoost算法,从理论角度保证其总能给出和批量AdaBoost相同的分类器,解决了传统在线Boosting在有限样本情况下难以很好逼近批量AdaBoost算法的问题。 (2)研究了AdaBoost算法中样本间隔分布与分类器偏差、方差之间的关系,并给出其偏差-方差分解形式。在此基础上讨论了弱分类器选择对分类器偏差、方差的影响,从理论角度解释为何目标检测与跟踪问题中不宜使用过强、过复杂的特征。 (3)针对不平衡数据分类问题,研究了漏检率、虚警率及两者的权衡模型,解释了为何原始Boosting在不平衡数据上漏检率高。在0-1损失函数基础上,提出一种自动权衡分类器漏检率和虚警率的Boosting算法,每轮迭代自动调整两者权重,从而避免人工参数设定和交叉验证参数选取,改进Boosting算法处理不平衡学习问题时的自适应性。 (4)提出了一种最大化样本可分性的半监督Boosting算法,通过“高密度区域局部散度最小、样本空间全局散度最大”准则,同时利用聚类假设和流形假设来学习未标注样本,更适用于解决实际问题。 (5)针对级联人脸检测器训练速度慢的问题,提出将haar特征选取问题作为线性空间上的稀疏投影向量的选择问题,并通过LDA准则选取最具鉴别性的特征,加速特征选取。进一步通过引入(e0)范数归一化,权衡了haar特征鉴别能力和计算代价,在提高了特征选取速度的同时,也降低了计算开销。 (6)针对传统在线Boosting在视觉目标跟踪应用中所面临的跟踪窗漂移问题,提出通过可分性最大化Boosting算法提高分类器准确率,改进每帧跟踪精度,进而避免跟踪误差累积造成的漂移。此外,通过使用固定阈值的弱分类器以及减少弱分类器个数,降低了分类器训练所需计算量,从而改进了目标跟踪的实时性。