论文部分内容阅读
人体动作识别在智能时代有着广泛的应用,而人体关键点检测是动作识别领域中的热门课题。然而基于人体关键点的动作识别领域仍存在一些待解决的问题。其一,通过二维图像难以获取准确的人体关键点信息,因此本文提出了一种基于目标分割网络的人体关键点检测方法,以提高人体关键点的检测精度;其二,传统方法难以寻找人体关键点和动作类别之间的映射关系,因此本文通过设计一个全连接神经网络以提取该映射关系,以实现准确的动作分类。具体的研究内容总结如下:(1)针对主流方法中存在检测精度与实时性之间的矛盾,本文提出了基于改进Mask RCNN的人体关键点检测方法。使用Mask RCNN网络结构中的掩模分支为关键点生成高质量的预测掩模结果,从而准确地定位人体关键点位置。实验结果表明,该方法解决了自顶向下方法在多人场景中存在的漏检问题,也避免了自底向上方法带来的关键点匹配错误问题。(2)对人体关键点检测算法进行了三方面的优化改进:其一,针对网络生成的人物目标感兴趣区域位置与真实值偏差大的问题,本文提出使用K-means聚类方法来改进锚点候选框尺寸的初始化方式,使生成的感兴趣区域尺寸能够更好地覆盖人物目标;其二,针对人物密集场景导致的目标漏检问题,本文提出使用高斯惩罚函数来改进非极大值抑制过程,提高模型检测精度的同时降低了模型对置信度阈值参数的敏感性;其三,针对传统感兴趣区域池化层结构导致细节特征丢失的问题,本文引入了Pr Ro I池化方法,使模型综合了更多的细节特征。实验结果表明,上述改进能有效地提升人体关键点的检测精度。(3)针对传统特征提取方法依赖人工设计的问题,本文使用全连接神经网络提取人体关键点与动作类别间的映射关系,从而提取到深层次的特征联系。然后将关键点检测网络与动作分类网络结合在一起,组成一套完整的动作识别系统,并在KTH等数据集上进行算法验证。实验结果表明,相比传统方法和主流的基于关键点的动作识别方法,本文方法在识别准确率上更具优势。