论文部分内容阅读
随着社会的不断进步,人们安全意识提高,智能监控系统被广泛部署。人脸识别是智能监控系统中非常关键的技术之一。但目前监控视频中人脸识别方法的识别准确率尚难以满足实际应用要求,这极大地影响了监控系统更好地发挥其智能性。为了提高监控视频中人脸识别方法的识别准确率,本文对基于深度学习的监控视频中人脸识别方法进行了改进。主要内容及贡献如下:1、针对监控视频中低质量人脸图像降低了人脸识别准确率的问题,提出了一种基于多尺度卷积神经网络的人脸图像质量评估方法。通过质量评估筛选出高质量人脸图像用于识别,提高识别率。方法主要包括两点:第一,采用了多尺度卷积神经网络预测质量分数。利用卷积神经网络强大的特征表达能力,输出一个融合了清晰度、光照、姿态、表情等因素的质量分数。而多尺度的加入能使得网络的特征学习更全面。第二,在训练样本准备阶段,通过结合人脸识别算法,自动对人脸图像进行质量分数标定。识别算法采用的是VGGFace模型提取特征,然后基于余弦相似度进行匹配。标定时,待标定图像与基准图像在特征空间的余弦相似度就是被自动标定的质量分数。在COLOR FERET及Multi-PIE数据集上的实验表明,在清晰度、姿态、光照、表情等质量因素变化时,本文方法能对人脸图像质量做出准确有效的评估。将质量评估模块加入人脸识别流程中,在自制的实际监控视频数据集进行实验,发现本文方法能够筛选出高质量的人脸图像,将识别准确率由64.76%提升至81%。最后,在Choke-Point数据集上的实验证明,本文方法训练得到质量评估模型具有一定的泛化性。2、针对实际监控视频中用深度学习模型调优时人脸数据集缺乏的问题,提出了一种人脸数据集自动收集与标定方法。深度学习模型调优是提高模型识别率的常用技巧之一。而调优需要一定量的带标签训练数据。本文基于监控视频,先通过人脸检测与跟踪得到含有杂质样本的初始数据集,再采用基于VGGFace特征的图聚类方法清除类内杂质样本,然后计算中心样本的相似度从而合并类间重复样本,自动收集与标定数据集。在收集到的数据集上对现有深度学习模型进行调优,使模型更适应实际监控视频的数据分布,提高识别效果。实验表明,通过本文方法收集得到的数据集纯净度达97.4%,整个过程是自动收集与标定,节省人力。利用收集到的数据集对VGGFace模型进行调优,调优之后的识别率为93.5%,比未调优的识别率提高约10%。3、利用以上研究成果,搭建了监控视频中人脸识别验证系统,对本文所提方法的有效性进行了验证。