三维人脸建模及表情动画技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:qiyesoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体计算机的迅速发展,计算机与人的交流日益增加,而人的面部传递着人类最广泛的信息,如情感、精神状态等,虽然每个人脸部特征很相似,但却有不同的表情特征,于是人脸建模与动画成为计算机视觉与计算机图形学中重要的研究课题。  本文针对人脸建模及动画中所涉及的特征提取、特定人脸建模、表情合成、口型合成及动画生成等方面的技术,进行了深入研究,提出了自己的方法,并设计实现了一个以人脸照片输入为基础的人脸建模及动画生成的原型系统。本文的主要工作包括:  1)人脸特征提取。主要研究人脸特征点定义和提取。人脸特征点要求既能反映人脸的整体几何结构,又能表示五官的局部特征。在进行特征点定义时,根据实际需要精简了MPEG-4中定义的人脸特征点的个数;使用特征点模板与手工标定结合的方法确定特征点的位置,并利用立体视觉原理恢复出特定人脸的特征点信息。  2)真实感特定人脸模型的重建。通过从输入的特定人脸图像中提取的特征点数据,用CANDIDE-3模型作为通用的3D人脸模型,对通用模型进行全局变换和局部变换,对于非特征点的调整,采用径向基函数进行插值。生成特定人脸的线框模型后,采用纹理映射的方法将纹理贴在人脸模型上,经过渲染可以得到特定人的真实感人脸模型。  3)表情动画合成及中文文本驱动的唇部动画生成。基于MPEG-4标准,结合面部动作编码系统,按照面部表情动作划分面部关键区域,在关键区域定义局部动作参数,控制合成面部表情。本文根据MPEG-4标准中人脸动画的工作原理,改进了MPEG-4中已知FAP(FacialAnimationParameter,人脸动画参数)和FaceDefTables(人脸动画定义表),计算FAP控制区内点的坐标的算法,结合自动计算和手工操作,实现以FAP流驱动的人脸动画。汉语口型的模拟是本文的另外一个组成部分。本文提炼出了汉语的七种口型,利用MPEG-4中定义的唇部相关FAP参数,通过手工调整获得了七种基本口型的数据,并归纳出汉语拼音与音素、音素与口型的关系,当输入拼音时,系统进行分析,做出适当的口型动作。  基于本文方法实现的人脸动画系统具有通用性强、数据量小、运算复杂度低、成本低廉等优点,具有广泛的应用价值。真实感三维人脸动画技术作为一种重要的人机交互方式,可以应用于人性化人机交互、虚拟主持人、网络会议、可视电话、远程教学、远程医疗诊断、电影制作、游戏娱乐等诸多领域。
其他文献
数字视频属于国家重点发展的信息产业领域,宽带网络和数字电视的迅速发展,使得视频点播、交互电视、视频网站等应用都将面临大量涌现的数字化视频数据,对视频摘要技术的研究对基
语义网提出以来,本体(ontology)正在成为人工智能和知识工程中的一种重要工具,在知识的获取、表示、分析和应用等方面具有重要的意义。其中,本体的构建与扩展是本体研究的核心和
课程编排对每个大学的管理部门来说都是每个学期不得不面对的一个挑战。大学课程编排问题是一个NP完全问题。对大多数大学教育机构来说,课程编排是最普通最难的问题之一。课程
网页和纯文本的结构差异性决定了传统的信息检索排序算法不能完全适应网络发展,基于链接分析的网页排序算法便应运而生,并成为现代搜索引擎的关键技术。知名的搜索引擎公司在对
本文从研究和设计的角度出发,对微博检索系统的相关理论与技术对比分析,提出改进,主要的改进工作为:第一,从伪相关反馈扩展角度出发,每个反馈的文档依据查询事件的爆发时间分布具
生物特征识别的几个重要步骤是:预处理、特征抽取、分类。而特征抽取在生物特征识别的过程中占有重要的地位。投影分析方法是常见的一类特征抽取方法。常见的投影分析方法有很
自然语言理解是计算机科学领域与人工智能领域中的一个重要方向,它主要研究用自然语言在人与计算机之间进行有效交流的理论和方法。计算机理解自然语言的前提条件是能够对自然
随着网络的普及和Web技术的不断创新,管理信息系统(MIS)的体系架构发生了重大的变化,从两层的C/S架构发展到三层的C/S/S或B/S/S架构.由于C/S/S本身的局限性, B/S/S架构的系统
随着无线技术的发展,无线网络速度的逐步提高,移动互联网的使用范围也逐渐扩大。安卓以及i OS技术越来越收到人们的追捧,成为移动互联网领域的热议技术。并且跨平台的HTML5已
文本分类最初是应文本信息检索的要求出现的,但是随着文本数据的激增,传统的分类研究方法己经不适合大规模文本分类,于是文本数据挖掘应运而生。作为文本数据挖掘的一个重要