论文部分内容阅读
人体检测技术是计算机视觉技术的研究热点之一,具有巨大的实际应用价值。人体检测技术的应用包括汽车辅助安全驾驶、智能感知接口、智能视频监控和基于内容的图像搜索等。同时,人体检测技术作为人体运动分析的一项关键技术,也是许多其他相关工作的基础,例如人体跟踪、行为识别、步态识别等。 在人体检测的众多难点中,遮挡问题是人体检测的重要性能瓶颈之一。基于部件的模型由于其在遮挡情况下的良好性能而得到广泛应用。然而,已有的基于部件的人体检测模型存在如下问题:(1)常用的基于部件的模型主要有基于CRF的模型和基于Hough投票的模型两种,前者强调部件之间的空间位置约束,但难以处理有遮挡的情况;后者强调部件之间的独立性,有较强的遮挡鲁棒性,却忽视了部件之间的相对空间位置约束。(2)由于受到人体姿态变化和标注信息不够准确等因素的影响,人体数据往往不能很好的对齐,从而不能很好的训练部件模型。鉴于此,已有的工作往往依赖于额外的部件标注信息,既费时费力,还不够准确。(3)在视频人体检测中,不仅存在遮挡问题,还经常有相邻帧的检测效果不稳定的问题。 本文致力于改善现有的基于部件的模型的上述缺点,提升在遮挡情况下的人体检测性能。本文的主要贡献如下: (1)本文综合现有两种主要的基于部件的模型的优点,提出了一种既考虑部件之间相对位置约束,又充分考虑遮挡鲁棒性的人体检测模型,并对遮挡进行了显式的建模,使之更加适用于遮挡情况下的人体检测问题。 (2)针对部件模型训练中人体数据弱对齐的难点,本文提出了一种不需要部件标注信息的迁移迭代训练算法。该算法首先从训练数据中挑选出一些对齐较好的数据,并在挑出的数据上训练各个部件的初始模型,然后再迭代地将初始模型迁移到整个训练集。整个训练过程全部自动完成,不需要额外的部件标注信息。此外,本文还考虑了视角差异对行人检测性能的影响,针对不同的视角训练了不同的检测模型,提高了模型对视角变化的鲁棒性。 (3)针对视频中的行人检测问题,本文将适用于静止图片的基于2D Hough投票的检测算法推广到视频中,提出了一种基于3D Hough投票的行人检测算法。该算法考虑了人体运动的时空连续性,取得了检测性能的提升。