论文部分内容阅读
随着互联网的普及,基于Android、iOS等系统的移动设备的普及度越来越广,用户数字阅读的需求也随之越来越强烈,数字资源聚合平台的建设也如火如荼。但是因为资源数量庞大、种类繁杂,如何满足用户基本功能需求并让纸质资源和数字资源相互配合使用依然存在大量问题。因此,一个可以满足数字资源聚合平台苛刻环境且能够打通纸质资源和数字资源的应用系统变得至关重要。光学字符识别的概念在二十世纪二十年代末被首次正式提出,在随后的几十年内取得了极大的发展。光学字符识别对于人类可能只是一项简单而又琐碎的任务,但要建立一个应用程序进行字符识别是很困难的,因为技术的限制,实际应用中的许多可变因素,例如摄像头的硬件条件、外界环境等,都会对识别结果造成较大的影响。传统的光学字符识别技术大多基于数学领域中的统计规律,如常用的模版匹配等。但是随着技术和理论的成熟,光学字符识别已经成为了人工智能、机器学习等领域的热门方向之一。在过去的几十年中,因为光学字符识别在许多行业都有着较高的应用需求,其已成为许多学者的研究目标。因此,本文认为研究一个结合机器学习理论且能够精确识别纸质资源的系统是非常有意义的。近几年,机器学习领域中的深度学习理论得到了如火如荼的发展。其概念起源于对人工神经网络的研究,其克服了传统神经网络在训练网络方面的复杂度,能够高效的抽象化有用信息并能去除冗余、矛盾的信息。而在光学字符识别系统中,神经网络通常充当字符分类器的功能,深度学习亦如此。本文开发的字符分类器模块结合了深度学习网络的高度抽象化能力和传统浅层神经网络的调优逼近能力,并通过测试确定了合理的网络参数、利用识别准确率量化了图像预处理对识别系统的影响及识别系统的鲁棒性,测试表明与深层网络、浅层网络和传统的模版匹配算法相比,改进的网络学习算法都有着一定的优势。尽管结合深层网络和浅层网络的算法有一定的优势,其也并不是完美无缺的。虽然在应用中可以看出,本系统已经基本可以完成字符识别的任务,但今后还将继续挖掘深度学习的潜能,提高识别能力,并利用不同的技巧来提升系统的鲁棒性并降低算法的复杂度。