表情互动中的人脸定位与跟踪

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户：wuzhi1979

【摘要】

：

对视频中的人脸进行实时定位和跟踪具有重要的研究意义和应用价值。本文以表情互动应用为背景，针对人脸定位和动作跟踪问题开展研究。在研究工程中，充分考虑到实际应用的需求和

【作者】

：

冯雪涛

【机构】

：

中国科学院自动化研究所

【出处】

：

中国科学院自动化研究所

【发表日期】

：

2009年期

【关键词】

：

人脸定位

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

对视频中的人脸进行实时定位和跟踪具有重要的研究意义和应用价值。本文以表情互动应用为背景，针对人脸定位和动作跟踪问题开展研究。在研究工程中，充分考虑到实际应用的需求和现有算法中存在的不足，提出了新的算法或对相关算法进行改进，获得了具有一定价值的研究结果。论文的主要内容和贡献如下：　　 (1)提出了一种适合于实时视频应用的基于眼睛检测的人脸定位算法，以及一种快速眨眼检测算法。在基于AdaBoost的分类器进行眼睛检测结果基础上，提出了一种基于检测结果之间距离量度的聚类算法去除误检。然后进一步精确搜索眼球中心位置，提取多种图像特征，建立动态更新的统计模型，使用Dempster-Shafer证据理论对每种特征对应的似然度进行合成，得到眨眼检测结果。实验结果显示，基于聚类的双眼定位算法在具有较高精度的同时，显著提高了定位速度；基于融合的眨眼检测算法也达到了较高的准确率。　　 (2)提出了一种使用运动历史图进行运动预测，改善对剧烈运动的人脸进行跟踪的稳定性的方法。通过对运动历史图进行分析，提出了一种基于黄金分割优化方法的运动方向和速度估计算法，相对已有的算法，能更好地克服物体边缘方向对运动估计的影响，得到更好的运动估计结果。对运动估计结果进行修正后，提出了两种不同的方式，将其与基于主动表观模型的人脸跟踪算法结合。结合之后的算法可以显著减少跟踪过程中失败的次数，提高头部剧烈运动时的跟踪稳定性，同时，运动预测也能减少跟踪算法迭代次数，提高了速度。　　 (3)提出了一种基于粒子滤波和特征匹配的三维头部跟踪算法。使用基于主成份分析的可变形三维网格模型，通过最小化网格模型上的关键点与输入图像上的对应关键点的距离，使模型拟合使用者的头部形状。利用三维模型以及初始化阶段获得的人脸纹理，可以渲染出不同姿态下的人脸图像。在渲染出的图像中选择特征点，并在输入图像上搜索对应位置，使用RANSAC方式去除特征匹配错误，然后根据特征点之间的对应关系估计模型姿态变化参数，实现粒子状态更新。使用平均归一化互相关计算渲染图像与实际图像的距离，实现粒子权重的计算，获得跟踪结果。实验表明，这种跟踪方法可以有效地对视频中的三维头部姿态进行跟踪。　　 (4)提出了一种改进的基于图像对齐的三维头部姿态和面部动作跟踪算法。算法使用三维人脸模型获得形状无关纹理，与初始化阶段建立的在线纹理模型进行对比，通过最小化两者的差距求出姿态和动作参数，并使用离线学习得到模型对跟踪结果进行评估。为了提高姿态跟踪的精度和稳定性，算法对Candide-3人脸模型进行了扩大，提出了使用了形状无关纹理的可信度指标及在线纹理模型的初始化完成度指标的方法，对人脸模型跟深度相关的形状系数进行估计的方法，以及对表情变化引起的人脸纹理改变进行处理的方法。为了克服非均匀光照和光照强度变化对图像对齐造成的干扰，提出了分片Gamma变换图像处理算法。为了提高跟踪速度和精度，提出了简化计算梯度矩阵的方法。实验表明，通过应用上述各种改进，跟踪算法在速度、精度、稳定性方面都获得了提高。

其他文献

基于ESB的面向服务架构的研究与应用

面向服务架构(SOA)用开放的标准把企业的业务功能包装成标准的服务。这种服务通过明确的、与实现无关的接口来定义，服务被松散绑定，并且可以通过强调位置透明性和互操作性的通

学位

Web服务分层架构就业服务平台企业服务总线

基于Log-Gabor小波和流形学习子空间算法的人脸识别

人脸识别是模式识别和计算机视觉中的一个研究热点。在实际应用中，由于人脸图像是较为复杂的，因此需要对它进行数据降维，以避免维数灾难问题，这一过程也称为特征提取。在众多特征

学位

Log-Gabor小波流形学习子空间算法人脸识别特征提取计算机视觉

龙芯平台安卓ARM动态库兼容系统的设计与实现

安卓操作系统是基于Linux内核的移动操作系统，具有源码开放、兼容硬件丰富和易于开发等特点。龙芯中科作为自主创新的国产处理器研发机构，在移动互联网全面兴起的时代，有肩负起

学位

龙芯平台安卓操作系统ARM动态库兼容系统二进制翻译

CBIR原型系统及相关技术的研究

随着多媒体技术和网络技术的飞速发展，多媒体信息的应用日益广泛，对规模越来越大的多媒体数据库进行有效的管理成为迫切需要解决的问题。高效、准确的多媒体检索策略是解决这一

学位

图像索引图像索引新闻图像新闻图像图像特征提取算法图像特征提取算法多媒体数据库多媒体数据库

多语种软件User Interface(UI)构件技术研究

近年来，随着软件复用技术的发展，基于构件开发作为一种软件复用的有效的方法学，得到了广泛的关注和发展。　　多语种构件库设计与实现是多语种软件技术支撑平台的开发与应用的

学位

软件复用多语种软件UI构件软件开发

综合风险垂直搜索引擎主题排序与用户反馈研究

网络信息爆炸性的增长和多元化的发展，不仅给人们带来了信息共享的快乐，同时也带来了“信息迷航”和“知识匮乏”等一系列问题。人们希望能快速地从搜索引擎中找到自己需要的信

学位

垂直搜索引擎PageRank算法主题排序用户点击反馈日志处理

基于MAPGIS的环境管理信息系统的开发

随着经济的高速发展，环境问题越来越受到人们的重视。环境污染、环境质量退化已经成为制约区域经济发展的主要因素之一，也给人类的可持续性发展及人类自身健康造成了极大的危害

学位

MAPGIS平台环境管理信息系统软件开发

一个以代码为中心的增量同步式双向工程工具

目前，越来越多的软件项目使用UML作为建模工具，一方面提高了软件开发的抽象层次，另一方面也可以生成框架代码，提高了开发效率。然而，在软件再工程和软件维护的过程中，程序代码和软

学位

软件开发双向工程工具代码分析代码生成逆向分析

基于pCTL的循环优化测试用例自动生成方法的研究与实现

编译优化是现代编译器的重要功能，编译优化测试对保障现代编译器质量有着重要作用。编译优化测试需要编写大量的测试用例程序作为输入，手工完成十分费时费力，因此，有必要研究编译

学位

编译优化测试用例自动生成法分支时序逻辑循环迭代覆盖率指标

邮件系统中基于Jabber协议的即时通信服务研究与实现

XMPP(Extensible Messaging and Presence Protocol)协议是由Jabber开源组织发起的，经IETF标准化了的网络即时通信协议，由于其开放性，可扩展性等优良特点受到即时通信领域的青睐

学位

邮件系统

表情互动中的人脸定位与跟踪

其他学术论文