手写字符和图像识别的神经网络激活函数研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:qazaq1313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符识别和图像分类是人工智能的一个重要研究方向。通过训练一组给定的输入字符图像和分类标签集合,来实现预测其他输入图像的分类标签的目的。神经网络能够自主提取图像特征,并在字符识别、图像分类、语音识别、视频目标跟踪等各个领域处理任务中具备抽象的能力。神经网络具有出色的性能,但随着“大数据”时代的发展,数据量每日不断增加,信息内容更加复杂,神经网络性能迎来了新的挑战。另外,随着硬件性能的提升,FPGA成为实现神经网络的有效平台。但是由于网络的结构日趋复杂,硬件的资源消耗也在相应增加。本文针对手写字符识别、越南文字符识别和图像分类实际应用,围绕神经网络结构和激活函数算法做了深入的研究,为未来神经网络的推进提供了借鉴和技术支持。本文的主要研究内容包括:
  在分析卷积神经网络结构特点的基础上,与单向连接方法相比,本文提出了一种CNN_GRU混合神经网络模型解决了神经网络全连接层的同一个网络层的神经元之间没有互相连接关系的问题。该模型采用卷积神经网络的卷积层和池化层实现图像特征提取,然后使用门控制循环单元代替卷积神经网络的全连接层,使得神经元之间具有时序连接关系,最后对于网络模型产生的过拟合现象,采用dropout技术进行优化。实验结果表明,所提出的CNN_GRU网络结构在MNIST手写数字上获得的准确率达到99.21%,与Lenet-5模型相比提高了0.16%,同时训练和测试的运行时间降低到57.91秒和3.54秒。
  提出了一种基于概率的Sigmoid激活函数分段拟合方法保证在降低硬件资源的同时提高网络的识别准确率。硬件实现神经网络算法时,通常需要对Sigmoid激活函数进行拟合,从而简化算法的复杂度,但现有的方法随着复杂度的下降,网络的性能也下降。为了解决上述问题,本文提出了一种基于神经网络神经元值的分布概率的Sigmoid分段线性拟合方法。该方法首先将Sigmoid函数划分为三个固定区域,然后根据每一层神经元值在这三个区域内的分布概率提出三种分段的处理方式,最后使用2-n为斜率系数的线性函数对Sigmoid进行拟合,提出三种不同的拟合行为应用于不同网络层。实验结果表明,所提出的Sigmoid激活函数的拟合方法在仅采用加法电路的情况下,在MNIST手写数字、VNCD越南字符和CIFAR-10图像数据集上分别能获得98.42%、68.29%和63.14%的识别准确率,比起其他方法最高可提高了0.57%、2.38%和1.99%。
  基于ReLU激活函数以及其现有改进方式的研究,提出了一种ReLU激活函数的改进方法SWishLU,以避免ReLU函数引起的神经元坏死的问题。该函数在负半轴部分使用Swish函数实现激活,使得函数同时具有Swish和ReLU两个函数的优点。这个函数不仅避免了神经元死亡的现象,而且合理地利用网络负输入信息,从而提高网络性能。实验结果表明,SwishLU激活函数使得网络在MNIST、VNCD和CIFAR-10数据集上获得的准确率分别为99.18%、82.82%和63.81%,与ReLU函数相比分别提高了0.09%、2.08%和0.74%。
  针对激活函数输出均值非等于零导致输出偏移问题,本文提出一种自适应反比例线性激活(Adaptive InversedProportional Linear Activation,AIPLA)函数。该函数采用分段激活方法,每一段根据分段点以及斜率系数的变化,得出不同的激活方式包括线性激活和反比例激活,结合了原点对称、上下有界、非单调和计算简单等优点,并且斜率系数可以通过训练过程学习自我进行更新,提高激活函数的灵活性。实验结果表明,所提出的激活函数能使得网络在MNIST、VNCD和CIFAR-10数据集上获得的最高准确率分别为99.32%、88.79%和65.59%,与现有激活函数相比分别提高了0.17%、6.35%和0.82%。同时,在同一个训练准确率的要求下,该函数需要的训练次数分别减少了4倍、4.5倍和1.41倍。
其他文献
植物内生菌与宿主长期共生,能够增强植物抵抗生物和非生物胁迫的能力。锰是植物生长发育所需的重要微量元素,但高浓度的锰会对植物产生严重毒害,筛选耐锰内生菌并接种于植物中,是提高植物耐锰的有效手段。本文从龙葵等植物中分离、鉴定出具有耐锰性的内生菌,并基于环介导等温扩增(LAMP)技术开发了快速鉴定的分子标记,随后对其最高耐受浓度、锰离子去除率等生物学特性进行研究,最后探究耐锰内生菌对小麦锰胁迫的响应。主
学位
学位
用平板培养测定法从188株根际微生物中筛选出20株对辣椒疫霉菌有拮抗作用的细菌,其中7株表现出对棉花枯萎病具有不同程度的拮抗性.该文从这20株拮抗菌中选出具有较强拮抗作用,能够分泌大量抗菌蛋白的两个菌株AI-01、FR-03.分别研究了pH值、发酵时间、通气量及不同培养基种类对二菌株产生拮抗物质的影响.测定了AI-01、FR-03对辣椒疫霉菌具有抗菌活性的最低有效含菌浓度及最低有效无菌滤液滤度.并
学位
该文综合了二阶矩和PDF(概率密度函数)概念的优点,提出了湍流燃烧的二阶矩-PDF(SOM-PDF)模型.该文对甲烷-空气旋流湍流燃烧和NO生成进行了实验研究.为了考察旋流数对燃料NO生成的影响,在燃料中加入少量的氨(NH)来模拟燃料氮.进一步,该文应用Reynolds应力方程模型和SOM-PDF湍流燃烧模型对轴对称旋流燃烧室中不同旋流数下的湍流流动、甲烷-倾家荡产气旋流湍流燃烧以及NO生成进行了
该文分析了配电系统可靠性研究的现状.基于电力市场条件下可靠性反映电价的特点,阐述了加强配电系统实时可靠性研究的必要性,并基于此,对配电系统实时可靠性的基本理论作了分析.该文建立了一套配电系统实时可靠性评估的故障遍历算法,其中包括基于信息熵理论的电力系统短期负荷预测的神经网络算法、基于功率前推回代法的配电网潮流算法和基于树的广义标准存储结构的故障遍历算法.该算法能有效考虑系统的负荷特征、系统的容量约
学位
为了提高横向功率器件的击穿性能以满足日益增长的设计需求,人们针对横向功率器件的漂移区进行了诸多优化。在这些技术中,漂移区横向变掺杂技术(Variation of Lateral Doping, VLD)是能够获得完全均匀表面电场的技术之一,且被认为是最成熟的技术。然而在实际制造过程中,横向变掺杂器件往往会面临一些实际问题。例如,由退火导致的漂移区纵向掺杂不均匀的影响以及由器件版图所带来的三维曲率效
在众多毫米波器件中,InP/InGaAsHBT器件凭借其优异的材料性能及卓越的高频特性广泛应用于航天系统,军事通讯,卫星等系统中,展现出了很大优势。然而在复杂的空间辐照环境中,InPHBT器件及电路的应用面临巨大的挑战。空间中的高能重离子、质子等对工作在其中的InPHBT器件及电路产生各种辐照损伤效应,例如,单粒子效应、位移效应等,这些辐照效应使得InPHBT器件或电路性能发生瞬时或永久的改变,进
随着信息的数据量呈指数级增加,大规模图像数据的快速检索越来越成为人们关注的领域。数据库往往存储了千万量级的图片,人们在日常处理中越来越需要从巨量的信息中快速的找到自己所需要的的内容,所以图像检索越来越重要,其应用范围越来越广泛,应用价值也越来越大,但是图像检索领域一直面临着检索速度、语义检索、存储代价等多方面的挑战。从基于文本的检索到基于内容的检索,检索系统的速度与精度一直在提升,存储代价也得到了
学位
随着大众健康意识的提高和大规模集成电路的发展,无线体域网(WBANs)中可穿戴的医疗设备为国民的身体健康提供了新的保护伞。生物医疗芯片是医疗设备最核心的部分。生物医疗芯片面临的设计难点包括:功耗高、功能复杂、性能要求高和可靠性高。因此本文主要对生物医疗芯片中核心电路的低功耗设计方法和关键实现技术展开深入的研究,具体研究内容如下:  1、电源管理模块中低功耗低压差线性稳压器(LDO)的关键技术研究,
在大数据时代,图像已经成为人们日常生活中主要的信息载体。然而图像在成像以及传输过程中会不可避免的引入各种失真,引发图像质量的衰减。而图像作为人类主观感知、机器视觉的主要信息源,其质量好坏直接决定所获取信息的有效性。因此如何评价图像质量,以及图像质量是否满足特定场景要求亟待解决,而这个问题的解决需要建立合理的图像质量评价方法与评价标准。客观图像质量评价方法的发展离不开数据库的支持,图像质量评价数据库