论文部分内容阅读
金融票据识别系统是当前文档分析与识别系统中的一个热点问题,包含票据分类、图像处理、字符切分与识别、以及文档图像压缩等一系列过程。本文对金融票据识别系统的多个方面进行了研究。在此基础上,本文建立了一个具有应用价值的金融票据识别系统,并已经应用于数家国内银行的上百套相关银行业务系统中。
本文的主要工作包括:
1.针对种类多、数量大、版面复杂和噪声干扰严重的金融票据彩色图像,本文提出了一种基于二叉树决策的层次型票据类型匹配方法。该方法利用三个判断器:基于票据版面结构的松弛匹配、基于OCR的票据标题识别和基于票据颜色的色彩分析,层次化的进行票据类型判断。
2.本文针对粘连断裂的印刷体数字行,提出了一神基于Viterbi算法的切分识别方案,该方案采用两次切分识别的层次型结构。在第二次切分识别过程中,首先,对于粘连断裂字符,在候选切分点区域,结合二值轮廓和灰度信息,采用基于Viterbi算法搜索的非直线路径进行切分,得到有效的切分路径;然后,结合分类器输出的可信度,采用Viterbi算法来合并前面得到的候选切分图像块,进行动态切分与识别。
3.本文提出了一种基于Boosting变体算法的特征集成方法。在该Boosting运行的每一回中,训练得到多个不同的弱分类器,每一个分类器由一种类型的特征训练得到;然后,利用加权投票法结合这些弱分类器,形成一个新的中间分类器作为该回的分类器。最后,结合所得到的中间分类器,形成最终分类器。
4.本文提出了一种利用JPEG2000,基于感兴趣区域技术(Region-Of-Interest,ROI)的文档图像编码方法。首先通过票据分类和目标检测,得到三种类型的ROI区域:信息提取区域、印章区域和手写体区域;然后,由这些ROI区域得到整张图像ROI的一个掩码层(Mask);最后,利用JPEG2000对票据图像进行压缩编码。
5.基于实验室以前的研究和开发基础,结合前面几大问题的相关解决方案,我们实现了一个具有应用水平的金融票据识别系统,并且已经应用于银行具体的相关业务系统中。