论文部分内容阅读
生物识别技术是经过采集人体的某一种或多种生物特征,经过处理后进行匹配识别从而验证个人信息的一种技术。利用外部图像采集或传感器设备提取生物特征信息,将其处理后转为统一的特征模板,并保存到数据库中,使用计算机及相关识别算法完成身份验证过程。与传统的识别技术(钥匙、身份证、密码等)相比,生物识别的安全性更高,保密性更好。另外,使用生物特征做身份识别还具有防伪性能好、便携、不易遗忘或丢失等优点。可用于生物识别技术的生物特征有很多,主要分为行为特征和生理特征两种,其中生理特征包括:人脸、虹膜、掌纹、静脉、视网膜、DNA、指纹等;行为特征则包括:声调、声色、行走时的步伐姿态、笔迹等。
虹膜属于人的一种特殊的生理特征,包含了很多交织相错的细小斑点、丝状纤维、沟壑、条纹、大小不一的隐窝等的纹理细节特征,散布在瞳孔与巩膜之间的圆环状区域,该区域由十分复杂的纤维状组织构成。在胎儿未出生前的发育阶段,虹膜就已经形成,在整个生命历程中除去某些特殊眼部疾病外,虹膜基本不会发生变化,十分稳定。因此这些细节特征及不变性使得每个人的虹膜都是特有的,使用虹膜作为生物识别和个人身份验证的特征信息具有唯一性。虹膜的唯一性与稳定性是很多其他生物特征所没有的优点,这使得虹膜在人体生物特征识别市场中将成为主流产品。
虹膜识别主要是利用人眼图像中虹膜环状区域的纹理特征形成特征模板,将测试样本与所有样本的特征模板进行匹配分析,相似度对比,完成识别过程。虹膜识别的过程主要包括:图像采集、定位、分割、特征提取、匹配五个部分。在定位之前,由于虹膜图像有睫毛、眼睑等干扰,所以对图像进行预处理,处理过程常用的是对其进行中值滤波、高斯滤波等处理。定位过程主要是将瞳孔与巩膜之间的虹膜圆环标识出来,主流提取虹膜圆环的方法是利用灰度值跃变进行Hough圆检测、Canny边缘检测的方法。分割过程是将提取的虹膜圆环分割成固定大小的矩阵数组,归一化处理便于后续的特征提取。目前,在虹膜图像的特征提取过程中,主要提取虹膜图像的像素幅值或频域的相位信息,其中应用最广泛的是提取幅度信息构建特征模板。匹配过程主要是样本与数据库所有样本逐一比对,经过相似度的对比分析,得出最优匹配结果。
本文提出了一种基于随机森林与多特征融合的虹膜识别算法,有效地解决了虹膜识别系统的特征单一、泛化能力及稳定性差的问题。使用局部二值模式(Local binary pattern)、S变换、Gabor小波变换三种方法提取虹膜特征,分别对归一化后的虹膜图像作不同窗口单元的LBP、不同方向的2D-Gabor变换、不同频率的S变换,将识别率、特征提取时间与匹配时间作为评判标准,取识别效果最好的三组作为后续使用的虹膜特征;模型搭建中将三种虹膜特征融合,并建立多棵决策树,匹配过程采用随机森林的方法,随机选择特征属性进行匹配。在每个样本与其他样本的匹配过程中,使用欧式距离作为匹配标准。本文实验的数据集采用了中科院CASIAV3.0-Interval数据库与自建虹膜数据库Iris_SDU。实验结果表明,该系统的平均识别率在V3.0数据库可以达到99%以上,Iris_SDU数据库可以达到95%以上。因此得出结论,随机森林的随机性提高了识别系统的识别率与泛化能力,使得算法更加稳定。
虹膜属于人的一种特殊的生理特征,包含了很多交织相错的细小斑点、丝状纤维、沟壑、条纹、大小不一的隐窝等的纹理细节特征,散布在瞳孔与巩膜之间的圆环状区域,该区域由十分复杂的纤维状组织构成。在胎儿未出生前的发育阶段,虹膜就已经形成,在整个生命历程中除去某些特殊眼部疾病外,虹膜基本不会发生变化,十分稳定。因此这些细节特征及不变性使得每个人的虹膜都是特有的,使用虹膜作为生物识别和个人身份验证的特征信息具有唯一性。虹膜的唯一性与稳定性是很多其他生物特征所没有的优点,这使得虹膜在人体生物特征识别市场中将成为主流产品。
虹膜识别主要是利用人眼图像中虹膜环状区域的纹理特征形成特征模板,将测试样本与所有样本的特征模板进行匹配分析,相似度对比,完成识别过程。虹膜识别的过程主要包括:图像采集、定位、分割、特征提取、匹配五个部分。在定位之前,由于虹膜图像有睫毛、眼睑等干扰,所以对图像进行预处理,处理过程常用的是对其进行中值滤波、高斯滤波等处理。定位过程主要是将瞳孔与巩膜之间的虹膜圆环标识出来,主流提取虹膜圆环的方法是利用灰度值跃变进行Hough圆检测、Canny边缘检测的方法。分割过程是将提取的虹膜圆环分割成固定大小的矩阵数组,归一化处理便于后续的特征提取。目前,在虹膜图像的特征提取过程中,主要提取虹膜图像的像素幅值或频域的相位信息,其中应用最广泛的是提取幅度信息构建特征模板。匹配过程主要是样本与数据库所有样本逐一比对,经过相似度的对比分析,得出最优匹配结果。
本文提出了一种基于随机森林与多特征融合的虹膜识别算法,有效地解决了虹膜识别系统的特征单一、泛化能力及稳定性差的问题。使用局部二值模式(Local binary pattern)、S变换、Gabor小波变换三种方法提取虹膜特征,分别对归一化后的虹膜图像作不同窗口单元的LBP、不同方向的2D-Gabor变换、不同频率的S变换,将识别率、特征提取时间与匹配时间作为评判标准,取识别效果最好的三组作为后续使用的虹膜特征;模型搭建中将三种虹膜特征融合,并建立多棵决策树,匹配过程采用随机森林的方法,随机选择特征属性进行匹配。在每个样本与其他样本的匹配过程中,使用欧式距离作为匹配标准。本文实验的数据集采用了中科院CASIAV3.0-Interval数据库与自建虹膜数据库Iris_SDU。实验结果表明,该系统的平均识别率在V3.0数据库可以达到99%以上,Iris_SDU数据库可以达到95%以上。因此得出结论,随机森林的随机性提高了识别系统的识别率与泛化能力,使得算法更加稳定。