论文部分内容阅读
摘要:随着科技的发展,电子信息技术在人们的工作与生活中应用越来越广泛。视频监控技术主要是应用于监控系统中,对图像信号进行采集、处理、存储,可以进行调出、回放等,起到安全防范的作用。不过,目前多数视频监控设备只是起到简单的监控作用,对于人脸识别定位,还需要进一步研究完善。
关键词:视频监控;人脸识别;定位
中图分类号:TN941文献标识码: A
人脸识别技术本身是一种基于计算机科学的图像信号处理技术,这套技术是通过一套信号通讯系统传输到计算机,由计算机对采集到的图像信号进行分析、处理,最后得出一些识别结论的电子信息技术。随着时代的发展与科学的进步,人脸识别技术将会大量地应用于人们的日常生活之中,像是人脸识别考勤机,安防门禁系统中的人脸识别仪,各种监控设备等等,给人们的工作生活带来了更多的便利与安全。
1.人脸识别算法
本文中探讨的是一新型算法,该算法是把视频图像运动的时序性与肤色特征两者结合起来,有效的减少了误差,将运动检测范围大大缩小,利用神经网络的分类特征来检测肤色区域。
此算法由三部分构成:首先,利用图像的运动信息提取人脸范围,删除掉非人脸的活动区域,通过此步骤,可以很大程度上缩小搜索区域,因此充分提高了运算速度。其次,将BP神经网络的肤色分割算法利用在提取的人脸搜索区域,由此可以提取出肤色区域,然后对肤色区域进行合并和分割,该步骤使用区域增长算法进行实现,便得到人脸识别候选区域。最后,利用人脸的基本信息对人脸候选区域进行验证,得到人脸定位的信息。该算法如图1所示。
图1 人脸定位算法步骤
2.算法描述
2.1 运动区域提取
本算法将采用帧间差分算法进行视频图像运动区域的提取。帧间差分算法可以将图像中运动的目标提取出来,即将动态图像和静态图像(背景图像)进行分割,该算法不仅简单,而且效率高。通过计算连续两帧图像汇总的灰度差值并设定一个阀值来判定哪些点是运动的,哪些点是静止的。
如公式(1)所示,△t是处理连续两帧图像的时间间隔,f(x,y,t)表示一帧图像,f(x,y,△t)表示下一帧图像,这两帧图像是连续的,T d 是设定的阀值。假若这两帧图像的差值绝对值要大于阀值,那么说明该像素点是运动的(前景区域),否则该像素点则为静止的(背景区域)。
(1)
2.2 肤色分割
对视频流中的连续两帧图像进行对比,根据分析可知,每帧图像是由背景图像和前景图像组成的,背景图像即静态图像,前景图像即动态图像。背景图像区域的像素点灰度值变化较小,前景图像区域的像素点灰度值变化较大,运动目标当前和原来所在的区域都包括在内。
肤色是人脸特征中一个非常重要的特征,目前广泛利用的人脸识别定位方法就是利用肤色对人脸进行识别定位,利用肤色检测方法不仅效率高,而且稳定性好,实现起来较为容易,运算速度也快,有利于实时性的特性。但是对于背景图像非常复杂的环境,肤色检测方法较为不适用,因为负责的背景图像会对该方法产生强烈的干扰,该干扰会降低检测结果的准确性。为了改善干扰造成的问题,本文结合帧间差分算法将背景图像和前景图像进行分离,使用肤色检测方法直接对前景图像进行检测,从而避免了复杂的背景环境产生的干扰。改进的算法不仅能很大程度上提高检测的准确性,而且还提高算法的运算效率,保证了在视频监控中人脸识别的及时性。色彩空间和肤色分割算法是进行人脸检测的关键问题,为了提高肤色分割对光照条件改变的鲁棒性,本文将像素点的RGB颜色空间变换到YC r C b 空间中,不使用RGB三种颜色信息进行判断,而是用色度和饱和度进行判断。其中,Y表示亮度信息,C r 表示红色分量的信息,C b 表示蓝色分量的信息。该像素点的空间转换举证如公式(2)所示。
(2)
为了提高肤色分割对复杂环境下的肤色检测的可靠性,本文提出一种基于BP神经网络的肤色分割算法,该分割算法使用不同颜色分量作为神经网络的分类特征,从而获取高灵敏度的分类结果,降低检测的错误率。
2.2.1 用于肤色检测的BP神经网络结构本算法所采用的神经BP网络结构为全连接前馈网络,该网络结构为三层,如图2所示。
图2 BP网络结构
2.2.2 网络训练样本集的选择和学习
网络训练样本集是非常重要的。在理论上,用什么样的样本集进行网络训练,则该网络就具有了识别该样本的能力。本文所创新的算法采用肤色区域的像素点样本集进行训练,并且包括了各种不同光照条件、不同背景、不同肤色的人脸图像进行训练,增加本算法的通用性和有效性。
本文训练样本集采用了L=800个不同类型的样本,分别为X 1 ,X 2 ,⋯,X L ,由于BP神经网络的学习算法是一种有教师的学习算法,因此对应的教师分别为d 1 ,d 2 ,⋯,d L ,则可以得到BP神经网络的每一层权值的迭代公式(3),其中n 0 为迭代次数。
该算法的学习过程如下:
(1)确定神经网络各层的权值和阀值;
(2)输入样本到神经网络中,根据式(2)计算神经元输出值和误差;
(3)根据式(3)修改各层的权值和阀值;
(4)重复(2)(3)(4)步骤直到样本总的输出神经元的误差小于给定的数值,则停止学习。
(3)
2.2.3 人脸候选区域分割
根据神经网络可以得到监控图像的二值图,但是二值图像不是一定100%准确的,或多或少都会存在出差和噪声,因此,本文通过下面2个步骤来对误差和噪声进行过滤盒分割,并得到最佳状态下的人脸候选区域。
(1)对每个像素点进行检测并对照二值图像,如果像素点的值为1,则检测像素点周围区域中的像素点,如果周围区域中的像素点值为1的个数小于所设定的阀值,那么该像素点为噪声像素点,将其值设为0,并伸出。否则保留该像素点。如果检测到该像素点的值为0,而周围区域中像素点为值1的个数大于所设定的另一个阀值,那么该像素点为有效像素点,将其数值改为1,并保留该点。
(2)使用区域增长方法分割联通的肤色区域,将不通的肤色区域分别用其最小邻接矩阵框出得到人脸候选区域。
2.2.4 候选人脸验证
本步骤主要是将不可能为人脸的区域过滤掉。该验证方法分为3个步骤:
(1)如果目标区域面积太小,则认为不是人脸区域,比如小于整幅图像面积的1/2000。
(2)根据目标区域的邻接矩阵的长和宽的比例来排除。如果长/宽大于设定的阀值,则该区域不是人脸区域,删除该区域。
(3)由于人臉区域的形状类似椭圆,因此可以利用扫描的方式来确认。根据椭圆的特征,如果满足区域的宽度逐渐增加然后减少的特征,从上往下依次扫描目标区域进行,则为人脸区域。如果不满足该规律,则该区域不是人脸区域,如图6所示最终的人脸区域。
3.结语
本文针对智能视频监控中的人脸识别定位检测提出了一套完整的解决方案,充分利用视频图像的连续性和人脸肤色信息,实现了快速进行人脸识别定位,该算法错误率低,效率高,运算速度快,而且还可以适用于各种复杂环境下的人脸定位。本方法可以广泛运用到智能视频监控中人脸识别定位检测当中,具有高效的实用价值。
参考文献
[1]艾海舟.基于肤色和模板的人脸检测[J].软件学报,2011,5(4):12-14.
[2]黄冠华,洪景新,郑文侃.彩色序列图像中的人脸快速定位研究[J].信息技术,2012,3(2):56-57.
[3]张永梅,韩焱,商细云.一种人脸的检测与定位方法[J].中北大学学报(自然科学版),2009(2):32-34.
关键词:视频监控;人脸识别;定位
中图分类号:TN941文献标识码: A
人脸识别技术本身是一种基于计算机科学的图像信号处理技术,这套技术是通过一套信号通讯系统传输到计算机,由计算机对采集到的图像信号进行分析、处理,最后得出一些识别结论的电子信息技术。随着时代的发展与科学的进步,人脸识别技术将会大量地应用于人们的日常生活之中,像是人脸识别考勤机,安防门禁系统中的人脸识别仪,各种监控设备等等,给人们的工作生活带来了更多的便利与安全。
1.人脸识别算法
本文中探讨的是一新型算法,该算法是把视频图像运动的时序性与肤色特征两者结合起来,有效的减少了误差,将运动检测范围大大缩小,利用神经网络的分类特征来检测肤色区域。
此算法由三部分构成:首先,利用图像的运动信息提取人脸范围,删除掉非人脸的活动区域,通过此步骤,可以很大程度上缩小搜索区域,因此充分提高了运算速度。其次,将BP神经网络的肤色分割算法利用在提取的人脸搜索区域,由此可以提取出肤色区域,然后对肤色区域进行合并和分割,该步骤使用区域增长算法进行实现,便得到人脸识别候选区域。最后,利用人脸的基本信息对人脸候选区域进行验证,得到人脸定位的信息。该算法如图1所示。
图1 人脸定位算法步骤
2.算法描述
2.1 运动区域提取
本算法将采用帧间差分算法进行视频图像运动区域的提取。帧间差分算法可以将图像中运动的目标提取出来,即将动态图像和静态图像(背景图像)进行分割,该算法不仅简单,而且效率高。通过计算连续两帧图像汇总的灰度差值并设定一个阀值来判定哪些点是运动的,哪些点是静止的。
如公式(1)所示,△t是处理连续两帧图像的时间间隔,f(x,y,t)表示一帧图像,f(x,y,△t)表示下一帧图像,这两帧图像是连续的,T d 是设定的阀值。假若这两帧图像的差值绝对值要大于阀值,那么说明该像素点是运动的(前景区域),否则该像素点则为静止的(背景区域)。
(1)
2.2 肤色分割
对视频流中的连续两帧图像进行对比,根据分析可知,每帧图像是由背景图像和前景图像组成的,背景图像即静态图像,前景图像即动态图像。背景图像区域的像素点灰度值变化较小,前景图像区域的像素点灰度值变化较大,运动目标当前和原来所在的区域都包括在内。
肤色是人脸特征中一个非常重要的特征,目前广泛利用的人脸识别定位方法就是利用肤色对人脸进行识别定位,利用肤色检测方法不仅效率高,而且稳定性好,实现起来较为容易,运算速度也快,有利于实时性的特性。但是对于背景图像非常复杂的环境,肤色检测方法较为不适用,因为负责的背景图像会对该方法产生强烈的干扰,该干扰会降低检测结果的准确性。为了改善干扰造成的问题,本文结合帧间差分算法将背景图像和前景图像进行分离,使用肤色检测方法直接对前景图像进行检测,从而避免了复杂的背景环境产生的干扰。改进的算法不仅能很大程度上提高检测的准确性,而且还提高算法的运算效率,保证了在视频监控中人脸识别的及时性。色彩空间和肤色分割算法是进行人脸检测的关键问题,为了提高肤色分割对光照条件改变的鲁棒性,本文将像素点的RGB颜色空间变换到YC r C b 空间中,不使用RGB三种颜色信息进行判断,而是用色度和饱和度进行判断。其中,Y表示亮度信息,C r 表示红色分量的信息,C b 表示蓝色分量的信息。该像素点的空间转换举证如公式(2)所示。
(2)
为了提高肤色分割对复杂环境下的肤色检测的可靠性,本文提出一种基于BP神经网络的肤色分割算法,该分割算法使用不同颜色分量作为神经网络的分类特征,从而获取高灵敏度的分类结果,降低检测的错误率。
2.2.1 用于肤色检测的BP神经网络结构本算法所采用的神经BP网络结构为全连接前馈网络,该网络结构为三层,如图2所示。
图2 BP网络结构
2.2.2 网络训练样本集的选择和学习
网络训练样本集是非常重要的。在理论上,用什么样的样本集进行网络训练,则该网络就具有了识别该样本的能力。本文所创新的算法采用肤色区域的像素点样本集进行训练,并且包括了各种不同光照条件、不同背景、不同肤色的人脸图像进行训练,增加本算法的通用性和有效性。
本文训练样本集采用了L=800个不同类型的样本,分别为X 1 ,X 2 ,⋯,X L ,由于BP神经网络的学习算法是一种有教师的学习算法,因此对应的教师分别为d 1 ,d 2 ,⋯,d L ,则可以得到BP神经网络的每一层权值的迭代公式(3),其中n 0 为迭代次数。
该算法的学习过程如下:
(1)确定神经网络各层的权值和阀值;
(2)输入样本到神经网络中,根据式(2)计算神经元输出值和误差;
(3)根据式(3)修改各层的权值和阀值;
(4)重复(2)(3)(4)步骤直到样本总的输出神经元的误差小于给定的数值,则停止学习。
(3)
2.2.3 人脸候选区域分割
根据神经网络可以得到监控图像的二值图,但是二值图像不是一定100%准确的,或多或少都会存在出差和噪声,因此,本文通过下面2个步骤来对误差和噪声进行过滤盒分割,并得到最佳状态下的人脸候选区域。
(1)对每个像素点进行检测并对照二值图像,如果像素点的值为1,则检测像素点周围区域中的像素点,如果周围区域中的像素点值为1的个数小于所设定的阀值,那么该像素点为噪声像素点,将其值设为0,并伸出。否则保留该像素点。如果检测到该像素点的值为0,而周围区域中像素点为值1的个数大于所设定的另一个阀值,那么该像素点为有效像素点,将其数值改为1,并保留该点。
(2)使用区域增长方法分割联通的肤色区域,将不通的肤色区域分别用其最小邻接矩阵框出得到人脸候选区域。
2.2.4 候选人脸验证
本步骤主要是将不可能为人脸的区域过滤掉。该验证方法分为3个步骤:
(1)如果目标区域面积太小,则认为不是人脸区域,比如小于整幅图像面积的1/2000。
(2)根据目标区域的邻接矩阵的长和宽的比例来排除。如果长/宽大于设定的阀值,则该区域不是人脸区域,删除该区域。
(3)由于人臉区域的形状类似椭圆,因此可以利用扫描的方式来确认。根据椭圆的特征,如果满足区域的宽度逐渐增加然后减少的特征,从上往下依次扫描目标区域进行,则为人脸区域。如果不满足该规律,则该区域不是人脸区域,如图6所示最终的人脸区域。
3.结语
本文针对智能视频监控中的人脸识别定位检测提出了一套完整的解决方案,充分利用视频图像的连续性和人脸肤色信息,实现了快速进行人脸识别定位,该算法错误率低,效率高,运算速度快,而且还可以适用于各种复杂环境下的人脸定位。本方法可以广泛运用到智能视频监控中人脸识别定位检测当中,具有高效的实用价值。
参考文献
[1]艾海舟.基于肤色和模板的人脸检测[J].软件学报,2011,5(4):12-14.
[2]黄冠华,洪景新,郑文侃.彩色序列图像中的人脸快速定位研究[J].信息技术,2012,3(2):56-57.
[3]张永梅,韩焱,商细云.一种人脸的检测与定位方法[J].中北大学学报(自然科学版),2009(2):32-34.