论文部分内容阅读
计算机视觉中的人体运动分析涉及了目标检测,目标跟踪以及人体行为动作识别等领域。在这些领域当中,动作识别在安全监控,人机交互,出入境管制以及基于内容的视频摘要和检索等方面有着广泛的应用前景。目前,针对这个活跃的课题,已经有大量的科研机构和研究者做了深入的研究。然而在真实场景中的人体活动往往存在着巨大的类内差异,准确而又快速的人体动作识别依然是一个极具挑战性和开放性的问题。由于人体动作识别技术涵盖范围广泛,涉及图像处理、计算机视觉、模式识别、机器学习领域的综合应用,本文重点研究视频中动作的特征表示,特征融合以及词袋模型等几方面的内容。并就其中涉及的一些相关具体问题做了深入的研究,主要的研究内容和贡献包括:1.研究了视频中人体动作的特征表示以及识别方法,包括光流特征,轮廓特征,时空兴趣点特征,词袋(bag of words)模型,主题模型以及判别模型等。广泛阅读当前动作识别领域的相关文献,对动作识别方法进行分类学习和整理。同时深入研究了动作表示中全局和局部的表示方法,为本文中动作特征的提取和融合奠定了基础。2.本文利用人体分块模型和光流特征提出一种简洁高效的动作表示方法。首先,人体分块模型将人体剪影分成各个区块,精确地表征出人体各部位的运动情况;其次,基于局部光流特征提出了一种精确稳定的运动描述子来表征运动信息。同时,利用运用上下文的方法,提取了人体动作空间的局部时序信息,即将动作的过去,现在以及将来联系起来。将三种类型的特征进行融合,最后采用词袋模型最为动作的最终表示方法。3.本文选择判别式模型作为动作识别的分类模型。该模型采用直方图交叉核的方法建立核函数,然后利用这个核函数来训练多类支持向量机的判别函数,从而对动作进行分类识别。在此基础上,本文利用包含全局的运动速度信息,采用一种两级分类系统,首先利用速度信息对人体动作进行初步的粗分类,然后再使用多类支持向量机的方法对动作进行最终的分类识别。本文的方法测试了两个公共数据集:Weizmann和KTH。通过各种对比实验以及实验分析表明:该算法取得了比较理想的识别结果,验证了提出方法的有效性。