基于稀疏表示和深度学习的第二代身份证识别

来源 :福州大学 | 被引量 : 1次 | 上传用户:JK0803_wantao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一代身份证作为频繁使用的有效证件,携带个人基本信息、身份证号码和人脸照片。本文身份证识别包括OCR字符识别和跨年龄人脸识别。由于提取的字符图像往往是断笔粘连模糊的低质量图像,人脸又受年龄影响,传统身份证识别精度和鲁棒性都不高。稀疏表示对特征选择不会很苛刻且对噪声有很好的鲁棒性,而深度学习有强大的特征提取能力、非线性表达能力和泛化能力,因此本文从稀疏表示和深度学习入手,分别提出基于稀疏表示的OCR身份证字符识别方法和基于深度学习的身份证跨年龄人脸识别方法。身份证的倾斜校正作为后续识别的基础。图像配准对两幅或多幅图像匹配校正,而SIFT具备光照不变性、旋转不变性和尺度不变性等优点,是当下公认最为稳定的特征匹配算法。因此,本文将首先对身份证基于SIFT图像配准校正。在身份证字符识别方面:由于稀疏表示中,对低质量严重的情况泛化性弱,而低质量字符可以看成是无遮挡字符与误差部分的结合,通过构建误差字典求解误差部分的稀疏系数可得到无遮挡字符。据此,本文提出一种对低质量鲁棒的稀疏表示身份证字符识别方法:首先提出一个自动切分法分别制作身份证标准字符库和低质量字符库,并生成对应的标准字符字典和低质量误差字典;然后,比对待识别身份证检测区与参照检测区的峰值信噪比,判断身份证字符图像质量;最后,根据字符图像质量类别求解相对应稀疏表示模型的稀疏系数,并残差分类得到字符识别结果。实验表明,本文身份证字符识别方法准确度比其他传统方法好。在身份证跨年龄人脸识别方面:跨年龄人脸识别不仅受年龄限制,还受表情、姿态等非受限条件的影响,使人脸在不同年龄段、不同环境下有丰富的类内差异性,难以提取鲁棒的年龄特征。跟传统人工特征提取算法比较,CNN网络能更好的表达特征间的相关性,FaceNet模型直接学习特征间的可分性并映射到欧式空间。据此,本文提出一种降低类内差异性的分年龄段人脸深度学习识别方法:首先对待识别人脸进行CNN网络年龄段估计;其次通过高斯模型判断年龄段估计的准确度;最后,若年龄段估计的准确度高,则对估计的年龄段与相邻两个年龄段的人脸库进行高斯加权的FaceNet模型人脸识别,否则,弃用不靠谱的年龄段估计,不分年龄段与整个人脸库识别。实验结果也表明本文跨年龄人脸识别方法能够提高精确度。
其他文献
电容层析成像(Electrical Capacitance Tomography,ECT)技术是自20世纪80年代借鉴医学CT技术发展起来的一种成本低廉且安全性能高的新型流动层析成像技术。它可以在不破坏封
无线可充电传感器网络(Wireless Rechargeable Sensor Networks,WRSNs)中,如何设计合理的路由协议,关系到节点能量动态平衡以及数据传输路径稳定性,进而影响网络的生命周期。
随着互联网信息技术的发展,各种网络服务层出不穷,使得互联网体系结构中的僵化问题日益严重。网络虚拟化技术可以使得在不改变底层物理网络架构的情况下,让多重异构的虚拟网络成为可能,现已成为解决未来网络架构的重要因素。作为网络虚拟化技术的关键,近年来对基本网络切片问题即单域虚拟网络映射问题的研究已取得了一些瞩目的成果,但随着网络服务的更新换代,单域网络片逐渐无法应对人们的需要。底层跨越多个自治域的网络切片
随着大数据技术的快速发展,用户拥有的数据量越来越大,这些海量的数据可能会超出个人用户所拥有的存储能力,导致用户难以实现将海量数据完全存储到本地这一目标。在这种背景
内生经济增长理论认为,创新是经济增长的内在源泉和不竭动力。近年来,以资本要素投入、资源环境消耗为代价的经济发展方式已经无法满足我国经济持续健康发展的需求。优化经济
在机械制造的自动化背景下,轴类零件安装间隙的快速重复检测是机械行业内的一类重要研究课题。目前,国内大多数企业对于轴类零件安装间隙的检测主要依赖人工完成,人工检测成
随着高性能计算在科学研究和海量数据处理中广泛应用,对高性能计算软件环境的完善成为了人们关注的焦点。编译技术作为软件和硬件连接的桥梁,对高效的编译技术的研究越来越受
由于陆地资源在不断枯竭,许多国家将目光转移到具有丰富矿产资源、渔业资源的海洋。智能水下机器人可自主实施水下环境中海洋资源的开采,避免人工水下作业带来的安全风险,而
目标检测作为计算机视觉领域的基本问题之一,得到了越来越多的关注。它是从图像处理到图像理解之间的关键步骤,其主要目的是为了从图像中识别出待检测目标,完成场景理解或行为分析的第一步,因而被广泛地应用到各个重要领域,如视频监控、智能交通、生物特征识别等。然而,目标检测技术依旧有很大的上升空间。针对实际场景中目标尺度大范围的变化,单一尺度的检测方法很难平衡虚检和漏检的问题。传统目标检测技术的处理方式就是采
在各种人机交互方式中,语音交互是其中非常重要的一种。尤其是通过自然语言的方式进行交互,是最直接、友好的方式,而自然语言语意理解技术在语音人机交互中有着重要的作用。本文就人机交互中,自然语言指令的理解算法进行研究。首先,根据家庭服务机器人的使用环境和应用场景构建了一个自然语言文本指令语料库,建立了意图树,并对语料库中各类指令进行意图标注,从而把文本指令理解问题转化为文本分类问题;其次,在传统的文本向