论文部分内容阅读
人体动作的表示与识别是近年来在计算机视觉和模式识别领域被广为研究的一个问题,其在智能视频监控、智能人机交互接口以及多媒体检索等领域中都具有巨大的潜在应用价值。本文回顾并总结了当今众多动作表示和识别的方法,并指出了其中存在的若干关键问题,针对这些问题我们尝试将人体检测和姿态估计整合到人体动作识别当中,提出了一种可以同时对视频中的人体动作进行时空定位和识别的统一框架。我们的方法基于人体姿态的特征表示,可变形部件模板被用于检测和表示人体的不同姿态,据我们所知,这是在计算机视觉领域中首次对可变形部件模板在整合人体动作、姿态估计和动作识别中的有效性的探索。相比于其他的方法,我们的方法主要有三点优势,首先,我们的方法不依赖于视频的预处理结果的质量,这些预处理结果主要包括可靠的人体跟踪、完美的前背景分割等;其次,我们提出了一种新的人体动作的紧致表示方法,该方法能够有效的编码人体动作内部的时间和空间特性;第三,由于人体动作被整合到了我们的统一框架当中,我们的算法具备同时识别相对复杂场景当中多人动作的能力。最后,我们进行了广泛的实验验证了算法的有效性。