基于图的三维骨骼人体行为识别研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ssoqyhm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人机交互、智能监控、视频检索等领域,人体行为识别具有很大的应用价值。它已吸引了众多研究者专注于这个方向的研究。近年来,基于RGB视频的人体行为识别的研究取得了很大进展,但是这个领域仍有很多问题需要解决,尤其是对于实时场景下的行为识别准确率不高。随着廉价深度传感设备的出现,越来越多的研究者关注于三维骨骼序列人体行为识别。尽管现有的算法在这个任务上取得了一定的成果,但是在算法的鲁棒性、识别的准确率以及算法的语义性等方面仍然有很多问题需要解决。  本文主要关注基于三维骨骼序列的人体行为识别,创新性地提出了基于图结构的骨骼行为表示及度量方式。本文首先提出了一种新的图核,它不仅可以更加有效地保留图的局部拓扑性,而且具有一定的可扩展性。接着我们分别提出了基于轨迹分割的骨骼序列无向图表示以及基于多视角的骨骼序列双图模型,并用所提出的图核度量了两种行为图之间的相似性从而完成了行为识别任务。通过大量的多样的实验,我们证明了所提出的算法的有效性。具体来说,论文的主要工作如下:  1)我们针对人体行为识别任务提出了一个新的图核,子图模式图核(Subgraph-pattern Graph Kernel,SPGK)。具体地,图被分解为一系列的子结构,我们称其为子图模式集(Subgraph-pattern Set,SPS)。SPS是一个共享中心节点的所有子图模式的集合。由于具有相对复杂的结构,它可以有效地挖掘图的局部拓扑信息。基于从两个图中所提取的子图模式集,我们利用动态规划算法,通过合并所有的从两个图中提取的子图模式集的相似性计算了最终的图核。我们的SPGK是一个可扩展的图核,它可以通过设置不同的基本核容易地转变为其它传统图核。我们使用图结构来建模视频中的行为。顶点对应局部描述子,边来度量它们之间的相似性。因此图中提取的SPS,即顶点和边的组合,可以被看作行为片段。SPS的高维拓扑结构可以充分地捕捉行为片段局部的时空信息。我们在几个公开的数据集上的实验证明所提出的方法超过了其它基于图的方法并且达到了与当时最新方法可比较的识别率。  2)目前存在的骨骼行为表示不仅不能有效地捕捉关节点运动的时空信息,而且对深度传感器和骨骼位置定位算法产生的噪声鲁棒性不足。基于这些问题,我们通过跟踪关节点的轨迹并且分割这些轨迹,提出了一个新的具有一定语义性的骨骼关节点行为底层表示,运动单元(motionlet)。在这个过程中,通过轨迹平滑、采样与分割,噪声的干扰得到了减少。然后我们组合了这些motionlet并将它们的时空关系保留在了边属性中,构建了一个无向全连接标签图来表示一个视频。进一步,子图模式图核被用来度量两个图之间的相似性。我们的图表示和图核均有很强的语义性。每一个顶点对应一个行为片段,顶点的相似性测量对应行为片段相似性的测量;每一个子图对应子行为,子图之间的比较对应子行为之间的比较。最后,SPGK直接作为SVM分类器的核对行为进行识别。为了评估我们所提出的方法,我们在几个公开数据集上完成了一系列的实验并且实现了最高的识别准确率。  3)我们对于人体骨骼行为序列提出了一个新的基于图的表示,多视角双图模型,并且提出了一个图核,分层树状模式图核(Hierarchical Tree-patternGraph Kernel,HTPGK),来测量两个骨骼行为序列之间的相似性。具体地,我们将骨骼序列投影到不同的二维平面。在不同投影面的骨骼行为充分地记录了一个行为不同的运动信息。对于每一个投影面,我们提取了它们对应的底层特征motionlet。这些motionlet被合并为两类图,时间图和空间图。它们可以从时间因果关系和空间位置关系两个角度来捕捉行为内部的局部拓扑信息。为了有效地比较两个图的相似性,我们基于不同层次的子结构分解提出了HTPGK图核,它可以从不同的语义层来度量两个行为之间的相似性。最后,我们利用高效贝叶斯多核学习算法将这些不同投影角度、时间和空间、以及不同语义层次的信息进行了融合。将HTPGK输入SVM分类器后,我们完成了三维骨骼行为识别任务。在UTKinect-Action3D数据库上我们做了丰富的实验,我们提出的算法不仅超过了最新的方法,而且得到了很多极具价值的结论。
其他文献
随着电子信息技术的飞速发展,现代高新技术条件下的战场将是信息化、智能化、精确化的战场。火炮自问世以来,一直是战争中火力作战的重要手段;火炮运动参数主要包括水平角和
打乒乓球对机器人来说是一项综合性挑战,尤其针对接打旋转球,对机器人的视觉系统、决策系统以及高速运动控制系统都提出了更高的要求。本文在已有机器人击打推挡球的基础上,重点
支持向量机(SVM)一直都是机器学习领域里的热点研究课题,在产业界也得到了广泛的应用。它建立在统计学习的VC维理论和结构风险最小理论的基础之上,泛化能力好,在很多任务中表现
针对定义在偏置换矩阵上的组合优化问题,本文提出了基于高斯平滑的渐非凸渐凹化算法,并将其应用于图匹配等组合优化问题。定义在偏置换矩阵上的组合优化问题是计算机科学领域的
作为3G增强技术之一的多用户检测由于能很好的减少多址干扰和解决远近效应问题,显著提高系统容量等方面的优越性,使得它在众多新技术中备受关注。众所周知,随着经济水平的发
HART智能设备以其兼容(4~20)mA模拟信号且具备数字通信功能的优势获得广泛地应用。数字通信的功能使其能够实现在线的监测、诊断、校验等。构建HART数字通信网络,实现HART设备
随着移动机器人应用范围的日益扩展,在动态、非结构环境下提高自主导航行为能力已经成为移动机器人研究领域的首要问题。本文以“863”高技术计划资助项目“模块化机器人体系
学位
随着计算技术的不断发展及互联网应用的日益普及,各行各业产生了大量信息数据,如何有效利用和挖掘过往数据,学术界和工业界开展了大量的探索与尝试。基于电商历史交易数据可以辅
海底热流数据是开展海洋油气资源综合评价的一个重要参数。利用测量的海底热流数据,结合盆地演化认识和数值手段,可以获得各烃源层所经历的温度史,借助有机质成熟模型,有望揭
月球是离地球最近的天体,探索月球是人类认识太空的第一步。相比地球,月球环境非常恶劣,人类无法长时间在月球上进行各种考察活动,将月球探测车送上月球,通过其采集月表的岩
学位