论文部分内容阅读
人体行为识别技术的飞速发展,使其逐渐渗入到许多行业,是计算机自动理解真实场景的重要步骤,有着广阔的应用前景,越来越多的研究人员对其投入研究。通过分析人体行为的复杂度,发现相对于单人行为而言,交互行为的识别存在复杂性高,冗余信息量大,特征维数高且难以区分等特点,因此交互行为的特征选取及表达对识别算法起着至关重要的作用。对交互动作的研究大部分基于RGB图像,虽然取得了较好的研究成果,但也存在一定的局限性。对于RGB图像,复杂的背景,光照强度,角度等因素都会给交互行为识别带来影响,使得识别率降低。所以在本文中,主要对如何结合深度图像选取交互动作的特征提取以及优化算法效率进行重点研究。本文的研究工作如下:利用多源信息的互补性,相应地提取了各自的特征。本文首先对深度图像采用Canny算子提取边缘特征,对RGB图像采用局部二值模式算子旋转不变模式提取纹理特征,采用光流直方图来描述动态特征;然后对提取的边缘特征及纹理特征进行加权融合;之后利用基于稀疏编码空间金字塔匹配模型(对静态融合特征和光流运动轨迹特征进行编码池化,将得到的池化特征再融合;最后采用支持向量机(Support Vector Machine,SVM)进行分类,实现交互行为识别。针对特征的贡献,使用权重融合机制择优特征融合。交互动作的复杂程度高,信息冗余量大,需要提取更强大的特征,针对此问题,本文采用低秩稀疏优化算法,最大程度上去除冗余和噪声的干扰,提取出干净的低秩矩阵。本文采用鲁棒主成分分析法提取融合编码特征的低秩矩阵,最后对特征的低秩矩阵采用SVM算法分类识别。针对复杂性问题使用稀疏超完备字典的方法压缩空间,使用低秩稀疏优化算法提高算法的效率,降低算法的复杂度。为了证明本文提出算法的有效性及优越性,在几个公共的行为数据集上进行实验,其中包括CAD-60数据集,MSR Action Pairs数据集和SBU数据集。采用前两个数据集对人物交互动作进行识别,采用第三个数据集对双人交互动作进行识别。本文在每个数据集上都和其他文献优秀的算法进行了对比,实验结果表明,本文提出的算法识别结果有所提高。