论文部分内容阅读
人体动作识别的关键问题是如何从底层数据中有效地挖掘高层语义信息,使计算机能够理解人类行为并更好地为人类服务。人体动作识别的研究融合了计算机视觉、图像处理、模式识别等多学科的研究成果,是一个多学科融合的重点研究方向。在人体动画、游戏、虚拟现实、人机交互、视频监控、体育运动分析、辅助临床医疗诊断等领域均有着广阔的应用前景。
近年来,大批研究者投身人体动作识别方向的研究,并取得了丰硕的研究成果。然而,这门研究还处于研究初期,现有的动作识别方法大都对视频采集环境及人体动作等做了严格的限制,距离实际应用还存在较大的差距。
本文的研究从人体的部件入手,挖掘不同人体动作中部件的表观及空间配置关系的变化。针对人体部件的不同组织模式,本文提出了两种人体动作的定位及识别方法,主要的研究内容与贡献总结如下:
(1)提出了一种基于人体姿态表示的动作定位与识别方法。其主要优势:(i)将人体检测、姿态估计与动作识别整合到一个统一的框架,避免了对前端的背景分割、人体检测跟踪等预处理步骤的依赖;(ii)提出了一种基于可变形部件模型的人体姿态及动作的特征表示方法,能够有效地编码人体部件的表观及空间配置特性;(iii)该方法能够同时定位和识别人体动作,具备在较为复杂场景下的多人多类动作同时定位与识别的能力。最后,我们通过广泛的实验验证了算法的有效性。
(2)提出了一种基于判别霍夫变换的动作检测方法,训练过程构建各动作的局部特征码本,测试过程将所有采集的局部特征与码本中码字进行匹配,利用匹配码字的统计信息对人体动作的中心位置进行投票来定位人体运动作。我们将霍夫变换放入一个判别式的学习框架中:(i)词典学习方面,将局部特征的表观信息与其空间分布信息融合在一起,为每个码字训练了一个判别函数作为局部特征与该码字的匹配度量;(ii)权重学习方面,采用了最优化准确率的判别式学习策略得到了一组最优权值,为每个码字的投票值进行了加权。最后,在面向图像帧的动作检测的实验中,我们的方法取得了令人满意的结果。