人脸面部运动分析与真实感动画研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:mythzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了从视频中跟踪复杂的非刚体运动的方法,以及从视频中提取可以用于动画合成的人脸面部运动参数的方法。文中的主要成果包括: 1.提出了概率主动轮廓模型以稳定的跟踪复杂纹理背景中非刚体变形物体的细致轮廓。概率主动轮廓模型的基本思想是将概率跟踪框架和时空主动轮廓线模型结合起来。概率跟踪的方法无需直接根据图象特征通过确定性的优化搜索算法来得到跟踪结果,而是采用一种多假设的预测一验证机制,从而提供了一种在复杂图象背景或图象特征不足条件下进行稳定跟踪的框架。主动轮廓线模型是一种合适的细致轮廓的优化搜索方法,在多假设的概率跟踪框架下,可以通过噪声模型在较大范围内合理的散布多个假设轮廓的分布,而每个假设轮廓都可以在主动轮廓模型的作用下进行细致演化,从而提高了算法在大帧间运动情况下细致轮廓跟踪的准确性。文中将概率主动轮廓模型应用到发音的嘴唇外轮廓的跟踪问题中,并通过实验得到了结果。 2.提出了基于非刚体变形物体本质结构学习的本质跟踪方法,以跟踪在存在图象噪声或图象特征不足情况下复杂非刚体运动的物体。本质跟踪方法的基本思想是学习非刚体运动变形的低维本质表示,同时在得到了低维本质表示的基础上通过模型分解以及训练学习再得到物体的本质动态模型,并应用到概率跟踪的框架中。本质跟踪的有效性主要就在于通过非线性降维所得到的低维本质状态的每一个维度都反映了复杂非刚体变形的一个主要的连续非线性变形模式,这样使得跟踪问题的状态空间被限制在一个合理的低维非线性流形上,从而简化了状态的搜索/求解过程。同时,根据训练所得到的本质动态模型具有混合高斯的形式,可以灵活有效的预测自主运动的物体状态。通过鱼轮廓的跟踪实验表明,本质跟踪算法在跟踪复杂变形的轮廓如无帧间对应的轮廓变形时比现有算法的准确性大大提高。 3.提出了基于本质面部变形空间和3D模型的本质面部运动跟踪算法。本质面部运动跟踪算法的基本思想是将本质跟踪算法应用到基于3D模型的人脸面部运动跟踪中,以解决头部自由运动情况下长时、稳定的面部运动跟踪问题。通过采用3D人脸模型的整体约束,以及通过采集大量的真实人脸面部运动数据来学习得到的紧凑的本质面部变形空间约束,并结合分区域的面部图象特征度量方法来分离刚体运动与非刚体运动的图像度量信息,达到了头部旋转运动与面部非刚体运动的自然分离。同时,采用分区域的面部图象特征度量方法也可以有效的去除和要跟踪的面部运动无关的图像纹理变化,并对与要跟踪的面部运动相关的图像纹理变化进行分区域加权,从而提高图象度量的有效性。通过对合成与真实视频的跟踪实验表明,本质面部运动跟踪算法能够稳定而长时的跟踪表情和说话人序列。 4.在以上研究成果的基础上建立了包括人脸建模、面部运动跟踪和个性化3D人脸动画的人脸数据综合处理系统。该系统采用了MPEG4兼容的参数定义,可根据不同的输入数据(3D扫描仪或多视角图象)快速建立人脸3D模型;其中采用了两种不同的方式跟踪人脸面部运动,以所获得的人脸面部运动参数可以进行真实感的人脸动画合成。
其他文献
随着互联网的广泛普及和大数据时代的来临,如何快速有效的获取有价值的信息成为摆在人们面前的一大难题。事件挖掘的任务是利用计算机自动地从无序杂乱的数据流中发现事件信息
时间序列分析作为数理统计学的一个专业分支,具有数据分析能力和独特的处理方法。在各种偶然因素的作用下,时间序列数据除了具有随机特性,数据之间还具有一定的统计上的相互关系
传统关系数据库模型经过近几十年发展,以它为基础的关系数据库系统得到了广泛的流行和认可.然而,它也有自身的不足,就是对于不确定的数据处理能力较差.随着应用面的扩大和数
广播电视经过几十年的发展,积累下来许多珍贵的电视节目资料。这些资料是对社会发展有着重要意义的图文声像复合媒体,是一笔不可复得的、极为贵重的资产。在今天数字化、网络化
该文借鉴了GIS中传统的二维数据管理技术,并在此基础之上发展了管理海量三维数据的能力,并在空间索引、数据压缩、动态调度等方面进行了有益的探索.设计并实现了一套完整的基
该课题在国家863计划项目——动态联盟协同项目管理系统的支持下,针对动态联盟环境下项目管理过程中的进度计划问题,在进度计划模式,进度计划图形技术,进度资源的平衡优化等
并行分布计算已经成为一种解决许多大型科学和工程问题的十分有效的方式,特别是在高阶矩阵运算方面,如解大型方程组等,并行计算的应用有效提高了求解的效率.M矩阵及逆M矩阵是
随着经济全球化和新技术革命特别是信息技术的发展,企业所处的市场环境发生了根本性的改变,市场竞争已由原来的单个企业之间的竞争转向企业集团与企业之间形成的供应链之间的竞
该文研究的是多模板的实时状态下的音频检索.研究的切入点是电视广告,研究的目标是要建立一个基于音频信息检索的电视广告监播系统,该系统的具体功能是对指定的几个电视广告,
随着多媒体技术及网络技术的飞速发展,人们对数字产品的获取极为迅捷方便,但是这些数字产品的原创者的版权和经济利益如何得到保护?数字产品是否安全、可信?围绕这一问题,近几年