论文部分内容阅读
自动人脸识别是一个典型的图像模式分析、理解与分类问题,涉及到模式识别、图像处理、计算机视觉、智能人机交互、认知科学等多个学科,在公共安全、信息安全等领域具有潜在的应用前景。但是,目前用于商业和研究的人脸识别系统,由于体积大、成本昂贵、结构复杂,不适用于门禁、视频监控等特殊场合。基于DAVINCI架构的嵌入式人脸识别系统不仅弥补了这些不足,同时其低功耗和高性能是智能IP摄像头的理想选择。从算法研究、优化与实现三个方面,论文着重研究了系统实现所面临的人脸实时检测、精确匹配和工程技术问题。其主要工作及创新点包括:
(1)成功搭建了基于DM6446双核架构的嵌入式人脸识别系统。完成了系统硬件、Bootloader、Linux设备驱动和文件系统的设计与优化。
(2)针对人脸检测过程中的数据传输瓶颈,首先提出了二维数据复用概念。然后,通过改变算法结构和图像分块,大大改善了Cache的数据复用效率。最后,结合DAVINCI的EDMA结构,提出并实现了基于DMA循环队列结构的二维数据复用。经典Ping-Pong结构只是实现了数据传输与处理之间的并行化,而未做到缓存块之间的数据复用。相反,Cache实现了数据复用,但是数据传输与处理是串行的。DMA循环队列结构结合了两者的优势,彻底消除了数据传输瓶颈问题。
(3)在算法实现方面,探讨了XDAIS算法标准规范和RTSC构件技术,并对人脸检测算法给予实现,提高了算法的可移植性和重用性;同时充分利用TI提供XDC包,比如Codec Engine、dsplink、cmem等,大大提高了系统的开发效率。
(4)将肤色模型与AdaBoost人脸检测算法结合,检测速度普遍提高4倍以上,同时降低了误检率。并提出了基于肤色分割质量评估的肤色百分比阈值估计,该阈值能动态反应光照对肤色分割的影响。
(5)针对“误匹配灾难”问题,本文提出了一种两级AdaBoost的人眼精确定位算法:第一层为通常的基于HAAR特征的AdaBoost人脸检测,用于确定人脸的大致区域,并通过统计确定两眼在人脸区域分布的先验概率;第二层为基于MCT特征,通过连续AdaBoost构造后验概率模型,根据后验概率的大小在人眼先验概率区域选定几个点(通常5~10)的加权平均作为人眼的精确定位。