论文部分内容阅读
人体三维模型广泛应用于影视动画,人机交互,增强现实和虚拟现实等领域。然而获取人体三维模型并非易事,通常需要大量的人工设计或使用昂贵的三维扫描仪。传统三维扫描仪价格昂贵,比如,用于扫描人体全身的Cyberware三维扫描仪售价达到了百万级别,且配置复杂。随着计算机计算能力的提高,低成本的深度传感,如Kinect,Xtion,Tango的普及,使得三维重建逐渐走向大众化市场。相较于传统三维激光扫描仪,深度传感器具有成本低,实时,操作方便等优点。而相较于基于图片的三维重建,深度传感器具有实时,点云密集,不受物体表面纹理和环境光照影响的优点。如何利用低成本的深度传感器快速的获取非刚体人体运动三维模型,并在此基础上对运动进行分析具有重要的研究意义和应用价值。 然而,这是个极具挑战性的问题。首先,低成本的深度传感器获取的深度数据具有噪声大,数据缺失,视角受限等缺点。如何融合这种具有缺失的噪声数据是三维重建的重要问题。其次,深度传感器每秒提供30~60帧左右的深度数据,每帧深度数据包含20~30万个点数据,如何实时融合大量的点云数据,对算法和计算能力提出了挑战。此外,在静态场景的重建,每次只需要估计六个自由度的变换参数,就可进行数据融合,而对于动态非刚体人体三维重建需要为人体表面上的每一个点估计一个六自由度的变换参数,其解空间巨大。如何快速的计算这些参数,是一个具有挑战的问题。最后,如何从这些大量的三维点云数据中分析出代表人体运动的关键点,对于运动分析、识别具有重大价值,同时也对算法提出了挑战。基于以上问题本文的主要工作和创新点有: 1)提出了一种基于物体表面统计特征的深度图去噪声算法,它的基本思想是利用物体表面的平滑性特征和噪声数据的加权融合。一方面,物体表面,比如人体表面往往具有平滑特性,而噪声数据区域不具有这样的特性。通过统计局部表面的平滑性特征可以有效去除噪声。另一方面,多帧深度数据的融合能够有效的降低噪声,通过不断融合降噪后的输入数据到物体表面,更新物体表面的统计特征,反过来更为有效的指导去除下一个输入帧的噪声。 2)提出了一种基于骨架驱动的快速非刚体人体运动三维重建算法。针对当前算法提取骨架不准确的问题,本文利用分割的人体局部点云配准对人体骨架提取进行修正,提高了骨架提取的准确性,当相邻两帧之间存在较大非刚体人体运动时,利用骨架驱动人体表面点云进行点云粗配准,在粗配准的基础上,利用非刚体点云融合算法进行点云的精细配准,得到精确的表面重建。本文方法有效解决了当前算法不能重建相邻两帧之间具有较大非刚体人体运动的问题。 3)提出了一种四维隐式曲面特征点4D-ISIP提取算法,该算法是对三维时空兴趣点算法3D-STIP的改进。3D-STIP特征点广泛应用于人体动作识别,其在二维灰度图像序列中提取特征点,不能反应真实的人体运动,且受到光照和人体运动遮挡的影响。4D-ISIP是在三维形状空间中提取的运动特征点,能够代表人体真实的运动轨迹。与3D-STIP相比,4D-ISIP能有效消除运动识别歧义性,同时对光照和遮挡鲁棒。