基于深度学习的水书图像识别算法研究与应用

来源 :中央民族大学 | 被引量 : 0次 | 上传用户:allen_liliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言文字是一个民族的精神文明之一,文字识别技术对文字的传播和文化传承起到很好的推进作用。在我国贵州地区有一种语言文字——水书,是一种古老的类象形文字,由于传承人员稀缺,导致水书传承中断,所以迫切需要进行数字化保护。传统的文字识别技术多是采用手动提取特征,然后设计分类器进行识别的模式。手动提取特征对专业知识的要求较高,人力成本也比较高,然而识别效果却不太理想。深度学习在模式识别任务方面的表现良好,给少数文字识别相关研究人员带来了新的灵感,并尝试使用深度学习来解决文字识别问题。基于深度学习的方法实现水书识别存在着几个问题。第一,水书目前还没有用于数据科学研究的完备数据集,缺乏专业数据人员对水书文字进行整理、存储、归类;第二,深度学习模型多种多样,多数是针对某一个问题而设计的,可移植性较差,科研人员将深度学习方法在水书识别上的尝试较少;第三,深度学习模型训练时的超参数设置很大程度上影响了模型的性能,超参数优化问题是诸多研究人员致力解决的问题。针对上述问题,本文对深度神经网络模型进行研究,设计了一个用于水书识别的卷积神经网络模型,并通过一种基于种群进化的超参数优化算法进行训练,实现水书文字识别任务。具体工作如下:1.提出一种基于种群进化的超参数优化算法。本文结合网格搜索与人工调试的优点,从进化算法中获得启发,提出一种基于种群进化的超参数优化算法,其主要思想是个体进化,种群选择,异步并行迭代训练以达到种群进化的结果。实验结果表明,在超参数设置问题上此算法相较于网格搜索有更优的效果。2.设计了一个应用于水书识别的卷积神经网络模型。通过理论验证,经验积累,本文详细分析了卷积神经网络的结构组成,论证了损失函数、激活函数等选择问题,设计了一个11层卷积网络结构,并采用本文提出的基于种群进化的超参数优化算法进行训练,在水书数据集数据量较多的标注集上进行训练验证,证实了模型设计的有效性。3.本文建立了一个水书古籍文字数据集,为深度学习的研究提供了实验数据。文中详细介绍了水书特点,从数据采集、到数据预处理、再到数据标注,详细介绍了水书数据集建立过程。设计了一个水书文字识别原型系统,将数据处理和文字识别功能进行集成,为水书的学习和传播提供了方便。综上,本文提出的基于种群进化的超参数优化算法为神经网络超参数设置提供了借鉴方法,水书文字识别的研究可以作为少数民族语言保护和文字识别的一个经验案例,为文字学和深度学习工作者进行深入研究作参考。
其他文献
利用DNAStar Protean软件对热带无爪螨主要致敏原Blo t 5的二级结构和表面特性进行分析,如理化性质、亲水性、表面可及性、可塑性等,预测Blo t 5蛋白的B抗原表位和T抗原表位
<正>走进"苹果之城"云南昭通,站在高高的山岗俯视漫山遍野的苹果树的时候,我很惊讶,因为这里的苹果树和我记忆中的一点都不一样!它们又细又矮,枝既不繁叶也不够茂,但苹果却一
为了使妊娠合并乙型肝炎患者能够顺利地分娩,我院采取综合护理措施,提高了护理效果,并获得令人满意的结果,报告如下。1临床资料2015年5月~2016年5月,将本院收治的妊娠合并乙
<正> 最近看到《陕西情报工作》1983年第1期有一篇很短的文章(见附录——编者),是祝贺我们国家的两个刊物《情报科学》和《情报学刊》创刊三周年的,它提出了这么一个问题:以
三维放疗计划系统(3D-radiation treatment planning system,简称3D-TPS)是目前肿瘤放射治疗研究的热点。三维治疗计划和CT模拟是实现三维放疗计划系统的关键步骤和关键技术,属
<正>为完成作为省政府系统专项调研课题之一的"放管服"改革调研,省政府研究室会同省编办,在书面调研青岛、德州、潍坊等市的基础上,对全省"放管服"改革情况进行了分析,提出了
饮料灌装机控制系统采用西门子S7-200系列的PLC做控制器,文中详细介绍了饮料灌装机控制系统的总体构成,仔细分析了系统的输入输出量,配置I/O口,传送带系统采用伺服电机,实现
在《论犹太人问题》中,马克思把对犹太人特性的批判上升到对资本主义政治国家的批判,把对犹太人问题的认识提高对整个人类命运的关切,把犹太人的解放推向了人类解放的高度,实现了
<正>2017年以来,沂南县认真贯彻落实党的十八大和十八届三中、四中、五中、六中全会精神,按照省、市统一部署,以全面深化改革为主线,主动适应新常态,坚持法治思维,着力深化"
为了规避主流社会的注意与网络治理,同性恋社群发展出多样的替代性表达方式。本文聚焦北京某男同性恋网络聊天室,结合丰富语料,探析性邀约话语的语言特征,涉及语篇结构、言语