论文部分内容阅读
手指静脉识别技术是近十年来新兴的生物特征识别技术。她具有防伪性好、识别率高等优点,因而具有广阔的市场前景。六年来作者所在的研究小组自主研发了手指静脉的采集设备,并在此基础上开发了北京大学体育课外锻炼考勤系统。在该系统三年多的稳定运行中,研究小组搜集了超过20,000名用户的80,000多根手指的约2,000,000张手指静脉图像。本文的研究正是在这个实际运行中的系统及其上的大规模数据库所构成的研究平台上展开的。因为这一研究平台是其他研究者很难获得的,因而在这一平台上,作者发现并探讨了一些前人不曾发现和探讨的问题。 通过对数据的观察与分析,作者发现:虽然不同手指的静脉图像确实如我们料想的那样存在着明显的差异,但是同一根手指的不同图像却并不像我们想象中的那样相似。这一现象导致了系统在拥有良好的区分不同手指的能力的同时,也存在着错误拒绝率(即将同一根手指的静脉图像错误地认证为来自不同手指的比率)偏高的问题。在实际系统中的表现是一些用户不得不伸两次甚至三次手才能通过系统认证,即一次性通过率偏低。为了提高一次性通过率,从而改进用户体验,缩短认证所需时间,提高系统单位时间吞吐能力,作者对同一根手指的不同图像变化较大的问题进行了深入的研究。 通过对多根手指在一年半的时间里在不同的时间点、地点、身体条件、气候环境下的跟踪研究,作者发现:同一根手指的静脉图像上不同区域的稳定性是不同的。有些区域在多次采样中基本保持不变,而另外一些区域则比较容易变化。由此作者提出了使用矩阵(可以与手指静脉图像等大)来描述不同区域的稳定性(作者称之为出现概率矩阵,Occurrence Probability Matrix,OPM),并在计算手指静脉图像之间的距离时使用这一矩阵的方法。具体做法是在计算两个手指静脉图像的距离时,稳定性高的区域对最终计算结果贡献较大,而稳定性低的区域贡献较小或不予统计。由此可以较好的消除由于同一根手指的不同图像之间的差异而带来的影响,从而提高系统的准确性。这种使用OPM的方法看上去是很自然的,但是在具体应用时要回答几个具体的问题:1)如何计算OPM?2)使用一根手指的多少个静脉图像来计算它的OPM?3)使用哪些手指静脉图像来计算OPM?4)随着时间的推移,前期的手指静脉图像在计算OPM时是否需要抛弃?5)如何使用OPM计算手指之间的距离? 作者在本文研究过程中具体回答了这些问题。首先,作者给出了一种基于统计经验的OPM计算方法。其次,通过设计系列实验,作者给出了计算OPM时所使用的手指图像的数量与系统错误率之间的统计关系图,并定量给出了实验所用系统应该采用的计算OPM的图像的最佳数量。再次,作者通过对比试验,发现了并非所有手指图像都应该加入到OPM的计算中。只有用那些与本手指的其他图像平均距离较近的手指图像计算OPM,才能最大限度的提高系统的准确率。同时,作者也发现随着时间的推移,手指图像是有一些缓慢变化的,因而使用更靠近当下时间的图像做模板识别效果更好。最后,作者给出了一种有效利用OPM计算手指静脉图像之间距离的方法。使用该方法,系统的错误率可以从9.8%下降到3.1%,这就很好地证明了OPM方法的有效性。应该指出的是,OPM的计算和基于OPM的手指静脉图像间距离的计算都是识别算法相关的。不同算法在计算OPM和距离时应使用不同的参数。 除了上述手指静脉局部特征稳定性的研究之外,作者在本文中还初步探讨了在大规模手指静脉图像库上进行1对N的检索的问题,提出了一种可适度容错的手指静脉编码方法并利用Local Sensiv e Hashing cLSH)算法实现了一种在大规模数据库上较为有效的检索策略。实验表明,本文设计的方案可以在10秒内,从一个有50.700个样本的注册数据库中得到检索响应。在错误率略微升高的情况下,其响应时间大大优于使用相同匹配算法的线性检索策略。