面向数字资源聚合平台的光学字符识别技术的研究

被引量 : 4次 | 上传用户:hao1238888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,基于Android、iOS等系统的移动设备的普及度越来越广,用户数字阅读的需求也随之越来越强烈,数字资源聚合平台的建设也如火如荼。但是因为资源数量庞大、种类繁杂,如何满足用户基本功能需求并让纸质资源和数字资源相互配合使用依然存在大量问题。因此,一个可以满足数字资源聚合平台苛刻环境且能够打通纸质资源和数字资源的应用系统变得至关重要。光学字符识别的概念在二十世纪二十年代末被首次正式提出,在随后的几十年内取得了极大的发展。光学字符识别对于人类可能只是一项简单而又琐碎的任务,但要建立一个应用程序进行字符识别是很困难的,因为技术的限制,实际应用中的许多可变因素,例如摄像头的硬件条件、外界环境等,都会对识别结果造成较大的影响。传统的光学字符识别技术大多基于数学领域中的统计规律,如常用的模版匹配等。但是随着技术和理论的成熟,光学字符识别已经成为了人工智能、机器学习等领域的热门方向之一。在过去的几十年中,因为光学字符识别在许多行业都有着较高的应用需求,其已成为许多学者的研究目标。因此,本文认为研究一个结合机器学习理论且能够精确识别纸质资源的系统是非常有意义的。近几年,机器学习领域中的深度学习理论得到了如火如荼的发展。其概念起源于对人工神经网络的研究,其克服了传统神经网络在训练网络方面的复杂度,能够高效的抽象化有用信息并能去除冗余、矛盾的信息。而在光学字符识别系统中,神经网络通常充当字符分类器的功能,深度学习亦如此。本文开发的字符分类器模块结合了深度学习网络的高度抽象化能力和传统浅层神经网络的调优逼近能力,并通过测试确定了合理的网络参数、利用识别准确率量化了图像预处理对识别系统的影响及识别系统的鲁棒性,测试表明与深层网络、浅层网络和传统的模版匹配算法相比,改进的网络学习算法都有着一定的优势。尽管结合深层网络和浅层网络的算法有一定的优势,其也并不是完美无缺的。虽然在应用中可以看出,本系统已经基本可以完成字符识别的任务,但今后还将继续挖掘深度学习的潜能,提高识别能力,并利用不同的技巧来提升系统的鲁棒性并降低算法的复杂度。
其他文献
<正> 前言肾移植护理上几个主要问题第一,是护理肾功能不全的特殊病理状态的患者,所以不同于一般外科;第二,利用他人的肾脏进行移植(供肾者是有血缘关系者,也可能是无血缘关
该文设计了一种以最大剪切强度来评价沥青与石料之间粘附性和水稳性的新方法。通过剪切拉伸试验测试了滨州70#沥青与花岗岩之间的粘附性,并将剪切拉伸试验和水煮法、浸水马歇
视频图像中的车辆检测与跟踪是智能交通领域中的关键技术和主要研究方向。检测和跟踪是实现车辆跟踪过程中不可或缺的两个部分,车辆检测模块可以实时检测视频序列帧中出现的
简述了嵌入式学科服务的内涵,阐述了嵌入式学科服务的特点和国内外高校嵌入式学科服务的实践现状,对我国高校图书馆嵌入式学科服务模式进行了分析。
在桥梁体系中,桥面铺装层既是主体结构的保护层,也是桥梁体系与外部荷载直接接触的受力层,其质量及健康程度直接影响到行车安全和舒适程度以及桥梁主体结构的耐久性。钢纤维
目的:探讨美罗培南在治疗重症医院获得性肺炎中的作用,对临床疗效进行分析研究。方法:2016年1月-2018年12月收治重症医院获得性肺炎患者72例,随机数字表法分为两组各36例。对
目的观察40岁以上围绝经期和绝经后女性骨密度(bone mineral density,BMD)的变化并分析其相关危险因素。方法选取2017年8月至2018年3月在我院门诊进行体检的40岁以上女性,详
<正> 课外阅读对于培养学生学习英语的兴趣、提高自学能力、运用能力有着极其重要的作用。正如《大纲》中指出的:“要提高学生阅读英语的能力,单纯通过教科书中的课文教学是
采用粉末冶金复压复烧技术制备出高密度的铜 碳复合材料,对两种成分铜 碳复合材料的显微组织、物理力学性能和耐磨性能进行了对比试验。结果表明:复压复烧后材料的密度得到显
波形钢腹板-双管弦杆-混凝土板组合梁是由混凝土顶板、哑铃型钢管混凝土下弦通过波形钢腹板连接组成的新型组合梁。同波形钢腹板PC箱梁相比,由于采用钢管混凝土下弦代替混凝