论文部分内容阅读
摘要 传统的农作物病害诊断主要依靠人工识别,需要从业者具有一定经验且主观性较强,存在误判现象。针对这一现象,提出了一种基于卷积神经网络的农作物病害识别方法。选取玉米和马铃薯的5种常见病害进行试验,构建了1个13层的卷积神经网络结构,并分析了不同池化方式及优化算法对该模型准确性的影响。同时采用十折交叉验证对模型鲁棒性进行评估,结果表明该模型具备良好的分类性能,对5种病害的平均识别率为93.95%,为玉米及马铃薯常见病害识别提供了一种新途径。
关键词 农作物病害;图像识别;卷积神经网络
中图分类号 S126 文献标识码 A 文章编号 0517-6611(2020)05-0242-04
doi:10.3969/j.issn.0517-6611.2020.05.068
开放科学(资源服务)标识码(OSID):
Abstract Traditional crop disease diagnosis mainly relies on manual recognition, which requires practitioners with certain experience and strong subjectivity, and there is a phenomenon of misjudgment. Aiming at this phenomenon, we proposed a method of crop disease identification based on convolutional neural network. Five common diseases of corn and potato were selected for experiment, a 13layer convolutional neural network structure was constructed, and the influence of different pooling modes and optimization algorithms on the accuracy of the model was analyzed. At the same time, the robustness of the model was evaluated by 10fold cross validation. The results showed that the model had good classification performance and the average recognition rate of five diseases was 93.95%, which provided a new way to identify common diseases of corn and potato.
Key words Crop diseases;Image recognition;Convolutional neural network
农业作为我国国民生产生活的首要产业,为国民经济的建设与发展提供保障。农业生产中的各种农作物,如粮食作物、油料作物、蔬菜作物、饲料作物、药用作物等与人民生活有着密不可分的联系。国家统计局公布的我国粮食生产数据显示,2017年全国粮食播种面积为1.12亿hm.2,比2016年减少81.47万hm.2[1]。农业种植结构的调整优化和粮食播种面积的减少亟需对粮食单产水平进行提升。但是在农作物的生长过程中容易受微生物、细菌、病毒等侵害,导致其性状发生改变,从而严重影响作物的产量。此外,随着全球气候变化所产生的环境剧变,病害发生概率较以往大幅提升。因此,及时有效地对农作物病害进行诊治对降低病害损失和提升作物产量尤为重要。
作物病害识别对识别准确度有一定的要求,传统的作物病害识别方法主要是通过观察病害的形态特征来确定病害种类,并且需要检测者具有长期的种植经验和丰富的专业知识。种植者一般采用已有的经验、对照专业的书籍、查询互联网和请教农业技术人员或专家等方法。因此对病害的识别耗时费力且较为主观,并且由于作物病害症状复杂多变,部分病害特征差异并不很明显,使得人工检测方法存在一定的误判现象。我国地域广袤、作物种植面积大,因此植保专家的数量难以得到满足需求,部分地区作物发生病害时会出现专家难求的状况,导致部分作物因无法及时确诊病情從而大面积发病,使种植者遭受了巨大的经济财产损失。因此,迫切需要一种科学、快速、准确的方法来替代已有的人工检测方法,从而提高作物病害的识别效率和识别准确率。
近年来,卷积神经网络[2-4]受到学者们的广泛关注,由于其在训练时可以不用人为提取特征而是直接对图像进行学习,省去了病斑分割这一过程,一方面降低了特征选取的主观性,另一方面对病害识别效率有所提升,部分学者利用卷积神经网络实现了对病害的精确识别[5]。龙满生等[6]利用深度卷积神经网络AlexNet模型对大规模数据集ImageNet进行训练,并采用微调(finetune)方法进行油茶病害图像识别,结果表明该方法对油茶藻斑病、软腐病、煤污病、黄化病识别有较高的准确率。张建华等[7]提出基于改进VGG-16卷积神经网络的棉花病害识别模型,优化了VGG-16模型结构和参数,结果显示该模型对棉花病害识别具备良好的分类性能。由此可以看出卷积神经网络在图像识别中的优势。鉴于此,笔者通过对玉米及马铃薯病害识别的研究,提出1种基于卷积神经网络的病害识别方法,通过对LeNet[8]、AlexNet[9]、VGGNet[10]等经典网络结构进行学习并结合研究作物特点,构建了适用于该研究的神经网络结构,并对其结构进行优化探究,为这2种作物的害识别与防治提供了一定的科学方法和依据。 1 材料与方法
1.1 试验数据及预处理
1.1.1 病害图像采集。以玉米及马铃薯常见病害为研究对象,分别采集了玉米灰斑病、玉米锈病、玉米枯叶病、马铃薯早疫病、马铃薯晚疫病5类病害样本进行试验,图像来源于植物村(Plant village)、美国植物病例协会(APS Net)等植物病害网站,其中共采集玉米灰斑病图像191张、玉米锈病图像519张、玉米枯叶病图像374张、马铃薯早疫病图像412张,马铃薯晚疫病图像380张,分别用病害首字母缩写HB(灰斑病)、XB(锈病)、KY(枯叶病)、ZY(早疫病)、WY(晚疫病)表示对应病害类别标签,采集到的部分图像如图1所示。
1.1.2 病害图像预处理。由于采集到的作物病害图片大小不一致,在含有全连接层的神经网络结构训练时,需要预先对采集到的图像进行resize处理,从而固定其输入维度。若不进行该操作则会导致全连接层的参数维度与前一层的特征图维度不一致进而导致训练提前结束[11]。所以该试验首先利用python的图形处理模块(PIL)对所采集到的病害图片进行归一化处理,将样本图片尺寸统一裁剪为像素128×128,便于作为卷积神经网络的输入。
同时,试验采集到的不同种类病害样本数目有一定差距,样本数目的不均衡往往会导致试验结果偏向样本数目较多的一类,为防止这一问题的发生对数据集进行了扩充。对采集到的小样本病害数据利用PIL模块进行了数据增强(data augmentation),对小样本病害数据进行了旋转操作,旋转角度分别为90°、180°、270°,将旋转后的图片存入相应的训练文件夹内,这就使得扩充完成后样本数目相差不大,降低了模型过拟合的风险。
1.2 试验方法
1.2.1 卷积神经网络。卷积神经网络一般由输入层(input layer)、卷积层(convolutional layer)、池化层(pooling layer)、全连接层(fully connected layer)和输出层(output layer)等组成。卷积层由若干个卷积单元组成,每个卷积单元的参数都是通过反向传播算法优化得到。卷积过程通过卷积核对输入图像进行卷积操作,其目的是提取图像的局部特征,从而得到多个特征图(feature map)。对于卷积层当采用方式SAME方式作为边界补充条件时,其卷积后特征图尺寸计算公式为:
池化层又叫下采样层(down sampling layer),由于图像在卷积层进行卷积操作之后会得到维度很大的特征,所以通常采用池化层对卷积后提取到的特征信息进行降维处理,以此减少网络参数来降低模型的计算量,降低过拟合的风险。全连接层(fully connected layer)在神经网络中主要起到“分类器”的作用,通过将输入图片的特征通过线性变换映射到样本标记空间,从而实现由图片转化为向量这一过程。
1.2.2 模型结构设计。通过学习LeNet、AlexNet、VGGNet等知名网络结构后,构建了一个13层的卷积神经网络结构,包含5个卷积层、5个池化层、2个全连接层和1个输出层。该模型结构如图2所示。
由图2可知,输入层图片尺寸为128×128,卷积过程作均进行补零操作,使得卷积后的图像尺寸与卷积前保持一致同时也降低了边缘数据丢失的问题。卷积层一和卷积层二使用尺寸为5×5的卷积核对输入图片进行卷积,分别得到32个feature maps和64个feature maps,每层对应特征图尺寸为64×64和32×32。卷积层三、四、五使用尺寸为3×3的卷积核对输入图片进行卷积,分别得到128个feature maps、256个feature maps和512个feature maps,每层对应特征图尺寸为16×16、8×8和4×4。
池化层均采用尺寸为2×2的核对卷积层输入进来的图片进行下采样,试验分别选取均值池化(average-pooling)、最大值池化(max-pooling)为池化方式。均值池化即选取图像区域内的平均值作为池化后输出结果,最大值池化通过选取图像区域内的最大值作为池化输出结果[12]。由于均值池化能更好的对图像背景信息进行保留而最大值池化能更好的保留图像的纹理信息,所以该试验对这2种池化方式进行探究,分析不同池化方式对模型准确率的影响。
该模型激活函数最终采用非线性激活函数ReLu,与传统的Sigmoid函数及Tanh函数相比ReLu函数具有单侧抑制的效果,通过使部分神经元输出为0从而使网络具有一定的稀疏性,降低了模型参数的同时减少了模型所需要的计算量,使模型收敛速度更快[14]。
2 结果与分析
2.1 池化方式对识别率的影响
该试验设置将所有样本训练30次,batch size为64,初始学习率(learning rate)為0.001,所有卷积层采用ReLU作为激活函数,为了避免过拟合现象的发生,设置正则化系数为0.005,试验采用单一变量原则即在对比试验中每次只改变其中1个变量,从而排除其他因素对结果的影响。试验首先比较了不同池化方式对模型准确率的影响,其结果如表1所示。由表1可知,采用最大池化方式和平均池化方式时模型对病害识别均有较高的准确率,其中采用平均池化方式时训练集和测试集的准确率较高(93.12%、91.25%),而采用最大值池化方式时准确率略微低于平均池化(92.18%、86.56%),可以看出该研究设计的病害识别模型采用平均池化方式效果更好。
2.2 不同优化算法对识别率的影响
卷积神经网络模型中含有大量的参数,对于这些参数学者们提出了众多算法来对其进行优化,为探究不同优化算法对病害识别准确率的影响,试验设计采用AdaGrad、Adam、RMSProp共3种优化算法。AdaGrad、Adam、RMSProp算法的学习率都是自适应的,即在训练的过程中根据参数出现频率自动的调整学习率。AdaGrad算法利用学习率与历史梯度的平方根比值作为当前训练的学习率,并且针对不同的变量参数允许使用不同的学习率进行优化。RMSProp算法可以消除梯度下降中的摆动,并允许使用1个更大的学习率来加快算法的学习速度。Adam是另一种学习率自适应优化算法,通过计算梯度的一阶矩估计和二阶矩估计来自适应学习率。 在模型训练的中末期由于迭代次数的增加,其梯度平方不断增大,即Gi,t不断增大,由公式可知当Gi,t很大时会导致学习率趋近于无穷小,这样就使得模型无法从图片中提取出更多的信息,出现模型准确率低的情况。而Adam算法可以看成对RMSProp算法的进一步优化,将momentum的与之结合,不仅仅考虑当前的梯度,还会考虑之前的累计梯度,使模型达到更好的效果。
2.3 模型鲁棒性分析
在进行神经网络模型训练时,单一测试集可能会具有偶然性和随机性。因此为了验证模型的稳定性和准确性,试验采用K折交叉验证(K-fold cross-validation)对模型进行评价,将作物病害图片分为K份,依次将其中K-1份作为训练集用于网络的训练,剩余1份作为测试集进行模型测试,交叉重复验证K次使得每份样本都被验证1次,综合K次实验后得到的结果均值对模型的鲁棒性进行评价[15]。对于试验则采用常用的十折交叉验证方法来对模型的鲁棒性进行评价,1~10次试验测试集平均识别准确率依次为93.43%、94.37%、95.31%、94.68%、92.81%、94.06%、93.12%、92.50%、95.00%、94.27%;10次试验模型准确率最高为95.31%,最低为92.50%,试验模型平均准确率为93.95%,综合10次试验结果来看,模型准确率相差不大,由此可以证明该试验模型的可靠性。
3 结论
作物病害识别一直是机器学习中的一个热门话题,传统的作物病害识别主观性较高存在一定误判现象,利用图像处理技术和模式识别方式对作物病害进行识别虽然有良好的表现,但是在特征的选取上较为复杂同时难以提取图像中的深层特征[5-10]。所以试验设计了一个卷积神经网络模型,避免了人为提取特征的复杂性,提升病害识别效率,同时选取马铃薯及玉米的常见病害作为试验研究对象,试验研究的主要结论如下:①利用卷积神经网络对玉米灰斑病、玉米锈病、玉米枯叶病、马铃薯早疫病、马铃薯晚疫病进行了识别,试验构建了一个13层的神经网络模型,结果表明该模型对上述5种病害能进行有效地识别,且平均识别准确率在90%以上。②在该模型的基础上比较分析了不同池化方式对模型准确率产生的影响,分别利用最大值池化和均值池化进行试验对比,结果表明采用均值池化的准确率要高于最大值池化的准确率。③试验选择了AdaGrad、RMSProp、Adam共3种优化算法进行对比试验,分析试验结果得出,试验模型采用Adam优化算法时其训练集准确率为93.12%,高于AdaGrad算法(84.44%)和RMSProp算法(91.25%),并且對该模型进行了十折交叉验证,结果表明该模型鲁棒性较好。
参考文献
[1]国家统计局.中国统计年鉴2018[M].北京:中国统计出版社,2018.
[2]周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251.
[3]陈先昌.基于卷积神经网络的深度学习算法与应用研究[D].杭州:浙江工商大学,2014.
[4]常亮,邓小明,周明全,等.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312.
[5]姜珊.基于卷积神经网络的水稻生长阶段优劣长势判别的研究[D].大庆:黑龙江八一农垦大学,2018.
[6]龙满生,欧阳春娟,刘欢,等.基于卷积神经网络与迁移学习的油茶病害图像识别[J].农业工程学报,2018,34(18):194-201.
[7]张建华,孔繁涛,吴建寨,等.基于改进VGG卷积神经网络的棉花病害识别模型[J].中国农业大学学报,2018,23(11):161-171.
[8]LECUN Y,BOTTOU L,BENGIO Y,et al.Gradientbased learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[9]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with deep convolutional neural networks[J].Advances in neural information processing systems,2012,25(2):1097-1105.
[10]SIMONYAN K,ZISSERMAN A.Very deep convolutional networks for largescale image recognition[R].2014:1409-1556.
[11]LONG J,SHELHAMER E,DARRELL T.Fully Convolutional networks for semantic segmentation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2014,39(4):640-651.
[12]杨东坡.基于深度学习的商品图像分类[D].大连:大连交通大学,2015.
[13]池燕玲.基于深度学习的人脸识别方法的研究[D].福州:福建师范大学,2015.
[14]JARRETT K,KAVUKCUOGLU K,RANZATO M,et al.What is the best multistage architecture for object recognition? In(ICCV’09)[C]//2009 IEEE 12th Znternational Conference on Computer Vision.Kyoto,Japan:IEEE,2009.
[15]卢官明,朱海锐,郝强,等.基于深度残差网络的人脸表情识别[J].数据采集与处理,2019,34(1):50-57.
关键词 农作物病害;图像识别;卷积神经网络
中图分类号 S126 文献标识码 A 文章编号 0517-6611(2020)05-0242-04
doi:10.3969/j.issn.0517-6611.2020.05.068
开放科学(资源服务)标识码(OSID):
Abstract Traditional crop disease diagnosis mainly relies on manual recognition, which requires practitioners with certain experience and strong subjectivity, and there is a phenomenon of misjudgment. Aiming at this phenomenon, we proposed a method of crop disease identification based on convolutional neural network. Five common diseases of corn and potato were selected for experiment, a 13layer convolutional neural network structure was constructed, and the influence of different pooling modes and optimization algorithms on the accuracy of the model was analyzed. At the same time, the robustness of the model was evaluated by 10fold cross validation. The results showed that the model had good classification performance and the average recognition rate of five diseases was 93.95%, which provided a new way to identify common diseases of corn and potato.
Key words Crop diseases;Image recognition;Convolutional neural network
农业作为我国国民生产生活的首要产业,为国民经济的建设与发展提供保障。农业生产中的各种农作物,如粮食作物、油料作物、蔬菜作物、饲料作物、药用作物等与人民生活有着密不可分的联系。国家统计局公布的我国粮食生产数据显示,2017年全国粮食播种面积为1.12亿hm.2,比2016年减少81.47万hm.2[1]。农业种植结构的调整优化和粮食播种面积的减少亟需对粮食单产水平进行提升。但是在农作物的生长过程中容易受微生物、细菌、病毒等侵害,导致其性状发生改变,从而严重影响作物的产量。此外,随着全球气候变化所产生的环境剧变,病害发生概率较以往大幅提升。因此,及时有效地对农作物病害进行诊治对降低病害损失和提升作物产量尤为重要。
作物病害识别对识别准确度有一定的要求,传统的作物病害识别方法主要是通过观察病害的形态特征来确定病害种类,并且需要检测者具有长期的种植经验和丰富的专业知识。种植者一般采用已有的经验、对照专业的书籍、查询互联网和请教农业技术人员或专家等方法。因此对病害的识别耗时费力且较为主观,并且由于作物病害症状复杂多变,部分病害特征差异并不很明显,使得人工检测方法存在一定的误判现象。我国地域广袤、作物种植面积大,因此植保专家的数量难以得到满足需求,部分地区作物发生病害时会出现专家难求的状况,导致部分作物因无法及时确诊病情從而大面积发病,使种植者遭受了巨大的经济财产损失。因此,迫切需要一种科学、快速、准确的方法来替代已有的人工检测方法,从而提高作物病害的识别效率和识别准确率。
近年来,卷积神经网络[2-4]受到学者们的广泛关注,由于其在训练时可以不用人为提取特征而是直接对图像进行学习,省去了病斑分割这一过程,一方面降低了特征选取的主观性,另一方面对病害识别效率有所提升,部分学者利用卷积神经网络实现了对病害的精确识别[5]。龙满生等[6]利用深度卷积神经网络AlexNet模型对大规模数据集ImageNet进行训练,并采用微调(finetune)方法进行油茶病害图像识别,结果表明该方法对油茶藻斑病、软腐病、煤污病、黄化病识别有较高的准确率。张建华等[7]提出基于改进VGG-16卷积神经网络的棉花病害识别模型,优化了VGG-16模型结构和参数,结果显示该模型对棉花病害识别具备良好的分类性能。由此可以看出卷积神经网络在图像识别中的优势。鉴于此,笔者通过对玉米及马铃薯病害识别的研究,提出1种基于卷积神经网络的病害识别方法,通过对LeNet[8]、AlexNet[9]、VGGNet[10]等经典网络结构进行学习并结合研究作物特点,构建了适用于该研究的神经网络结构,并对其结构进行优化探究,为这2种作物的害识别与防治提供了一定的科学方法和依据。 1 材料与方法
1.1 试验数据及预处理
1.1.1 病害图像采集。以玉米及马铃薯常见病害为研究对象,分别采集了玉米灰斑病、玉米锈病、玉米枯叶病、马铃薯早疫病、马铃薯晚疫病5类病害样本进行试验,图像来源于植物村(Plant village)、美国植物病例协会(APS Net)等植物病害网站,其中共采集玉米灰斑病图像191张、玉米锈病图像519张、玉米枯叶病图像374张、马铃薯早疫病图像412张,马铃薯晚疫病图像380张,分别用病害首字母缩写HB(灰斑病)、XB(锈病)、KY(枯叶病)、ZY(早疫病)、WY(晚疫病)表示对应病害类别标签,采集到的部分图像如图1所示。
1.1.2 病害图像预处理。由于采集到的作物病害图片大小不一致,在含有全连接层的神经网络结构训练时,需要预先对采集到的图像进行resize处理,从而固定其输入维度。若不进行该操作则会导致全连接层的参数维度与前一层的特征图维度不一致进而导致训练提前结束[11]。所以该试验首先利用python的图形处理模块(PIL)对所采集到的病害图片进行归一化处理,将样本图片尺寸统一裁剪为像素128×128,便于作为卷积神经网络的输入。
同时,试验采集到的不同种类病害样本数目有一定差距,样本数目的不均衡往往会导致试验结果偏向样本数目较多的一类,为防止这一问题的发生对数据集进行了扩充。对采集到的小样本病害数据利用PIL模块进行了数据增强(data augmentation),对小样本病害数据进行了旋转操作,旋转角度分别为90°、180°、270°,将旋转后的图片存入相应的训练文件夹内,这就使得扩充完成后样本数目相差不大,降低了模型过拟合的风险。
1.2 试验方法
1.2.1 卷积神经网络。卷积神经网络一般由输入层(input layer)、卷积层(convolutional layer)、池化层(pooling layer)、全连接层(fully connected layer)和输出层(output layer)等组成。卷积层由若干个卷积单元组成,每个卷积单元的参数都是通过反向传播算法优化得到。卷积过程通过卷积核对输入图像进行卷积操作,其目的是提取图像的局部特征,从而得到多个特征图(feature map)。对于卷积层当采用方式SAME方式作为边界补充条件时,其卷积后特征图尺寸计算公式为:
池化层又叫下采样层(down sampling layer),由于图像在卷积层进行卷积操作之后会得到维度很大的特征,所以通常采用池化层对卷积后提取到的特征信息进行降维处理,以此减少网络参数来降低模型的计算量,降低过拟合的风险。全连接层(fully connected layer)在神经网络中主要起到“分类器”的作用,通过将输入图片的特征通过线性变换映射到样本标记空间,从而实现由图片转化为向量这一过程。
1.2.2 模型结构设计。通过学习LeNet、AlexNet、VGGNet等知名网络结构后,构建了一个13层的卷积神经网络结构,包含5个卷积层、5个池化层、2个全连接层和1个输出层。该模型结构如图2所示。
由图2可知,输入层图片尺寸为128×128,卷积过程作均进行补零操作,使得卷积后的图像尺寸与卷积前保持一致同时也降低了边缘数据丢失的问题。卷积层一和卷积层二使用尺寸为5×5的卷积核对输入图片进行卷积,分别得到32个feature maps和64个feature maps,每层对应特征图尺寸为64×64和32×32。卷积层三、四、五使用尺寸为3×3的卷积核对输入图片进行卷积,分别得到128个feature maps、256个feature maps和512个feature maps,每层对应特征图尺寸为16×16、8×8和4×4。
池化层均采用尺寸为2×2的核对卷积层输入进来的图片进行下采样,试验分别选取均值池化(average-pooling)、最大值池化(max-pooling)为池化方式。均值池化即选取图像区域内的平均值作为池化后输出结果,最大值池化通过选取图像区域内的最大值作为池化输出结果[12]。由于均值池化能更好的对图像背景信息进行保留而最大值池化能更好的保留图像的纹理信息,所以该试验对这2种池化方式进行探究,分析不同池化方式对模型准确率的影响。
该模型激活函数最终采用非线性激活函数ReLu,与传统的Sigmoid函数及Tanh函数相比ReLu函数具有单侧抑制的效果,通过使部分神经元输出为0从而使网络具有一定的稀疏性,降低了模型参数的同时减少了模型所需要的计算量,使模型收敛速度更快[14]。
2 结果与分析
2.1 池化方式对识别率的影响
该试验设置将所有样本训练30次,batch size为64,初始学习率(learning rate)為0.001,所有卷积层采用ReLU作为激活函数,为了避免过拟合现象的发生,设置正则化系数为0.005,试验采用单一变量原则即在对比试验中每次只改变其中1个变量,从而排除其他因素对结果的影响。试验首先比较了不同池化方式对模型准确率的影响,其结果如表1所示。由表1可知,采用最大池化方式和平均池化方式时模型对病害识别均有较高的准确率,其中采用平均池化方式时训练集和测试集的准确率较高(93.12%、91.25%),而采用最大值池化方式时准确率略微低于平均池化(92.18%、86.56%),可以看出该研究设计的病害识别模型采用平均池化方式效果更好。
2.2 不同优化算法对识别率的影响
卷积神经网络模型中含有大量的参数,对于这些参数学者们提出了众多算法来对其进行优化,为探究不同优化算法对病害识别准确率的影响,试验设计采用AdaGrad、Adam、RMSProp共3种优化算法。AdaGrad、Adam、RMSProp算法的学习率都是自适应的,即在训练的过程中根据参数出现频率自动的调整学习率。AdaGrad算法利用学习率与历史梯度的平方根比值作为当前训练的学习率,并且针对不同的变量参数允许使用不同的学习率进行优化。RMSProp算法可以消除梯度下降中的摆动,并允许使用1个更大的学习率来加快算法的学习速度。Adam是另一种学习率自适应优化算法,通过计算梯度的一阶矩估计和二阶矩估计来自适应学习率。 在模型训练的中末期由于迭代次数的增加,其梯度平方不断增大,即Gi,t不断增大,由公式可知当Gi,t很大时会导致学习率趋近于无穷小,这样就使得模型无法从图片中提取出更多的信息,出现模型准确率低的情况。而Adam算法可以看成对RMSProp算法的进一步优化,将momentum的与之结合,不仅仅考虑当前的梯度,还会考虑之前的累计梯度,使模型达到更好的效果。
2.3 模型鲁棒性分析
在进行神经网络模型训练时,单一测试集可能会具有偶然性和随机性。因此为了验证模型的稳定性和准确性,试验采用K折交叉验证(K-fold cross-validation)对模型进行评价,将作物病害图片分为K份,依次将其中K-1份作为训练集用于网络的训练,剩余1份作为测试集进行模型测试,交叉重复验证K次使得每份样本都被验证1次,综合K次实验后得到的结果均值对模型的鲁棒性进行评价[15]。对于试验则采用常用的十折交叉验证方法来对模型的鲁棒性进行评价,1~10次试验测试集平均识别准确率依次为93.43%、94.37%、95.31%、94.68%、92.81%、94.06%、93.12%、92.50%、95.00%、94.27%;10次试验模型准确率最高为95.31%,最低为92.50%,试验模型平均准确率为93.95%,综合10次试验结果来看,模型准确率相差不大,由此可以证明该试验模型的可靠性。
3 结论
作物病害识别一直是机器学习中的一个热门话题,传统的作物病害识别主观性较高存在一定误判现象,利用图像处理技术和模式识别方式对作物病害进行识别虽然有良好的表现,但是在特征的选取上较为复杂同时难以提取图像中的深层特征[5-10]。所以试验设计了一个卷积神经网络模型,避免了人为提取特征的复杂性,提升病害识别效率,同时选取马铃薯及玉米的常见病害作为试验研究对象,试验研究的主要结论如下:①利用卷积神经网络对玉米灰斑病、玉米锈病、玉米枯叶病、马铃薯早疫病、马铃薯晚疫病进行了识别,试验构建了一个13层的神经网络模型,结果表明该模型对上述5种病害能进行有效地识别,且平均识别准确率在90%以上。②在该模型的基础上比较分析了不同池化方式对模型准确率产生的影响,分别利用最大值池化和均值池化进行试验对比,结果表明采用均值池化的准确率要高于最大值池化的准确率。③试验选择了AdaGrad、RMSProp、Adam共3种优化算法进行对比试验,分析试验结果得出,试验模型采用Adam优化算法时其训练集准确率为93.12%,高于AdaGrad算法(84.44%)和RMSProp算法(91.25%),并且對该模型进行了十折交叉验证,结果表明该模型鲁棒性较好。
参考文献
[1]国家统计局.中国统计年鉴2018[M].北京:中国统计出版社,2018.
[2]周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251.
[3]陈先昌.基于卷积神经网络的深度学习算法与应用研究[D].杭州:浙江工商大学,2014.
[4]常亮,邓小明,周明全,等.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312.
[5]姜珊.基于卷积神经网络的水稻生长阶段优劣长势判别的研究[D].大庆:黑龙江八一农垦大学,2018.
[6]龙满生,欧阳春娟,刘欢,等.基于卷积神经网络与迁移学习的油茶病害图像识别[J].农业工程学报,2018,34(18):194-201.
[7]张建华,孔繁涛,吴建寨,等.基于改进VGG卷积神经网络的棉花病害识别模型[J].中国农业大学学报,2018,23(11):161-171.
[8]LECUN Y,BOTTOU L,BENGIO Y,et al.Gradientbased learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[9]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with deep convolutional neural networks[J].Advances in neural information processing systems,2012,25(2):1097-1105.
[10]SIMONYAN K,ZISSERMAN A.Very deep convolutional networks for largescale image recognition[R].2014:1409-1556.
[11]LONG J,SHELHAMER E,DARRELL T.Fully Convolutional networks for semantic segmentation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2014,39(4):640-651.
[12]杨东坡.基于深度学习的商品图像分类[D].大连:大连交通大学,2015.
[13]池燕玲.基于深度学习的人脸识别方法的研究[D].福州:福建师范大学,2015.
[14]JARRETT K,KAVUKCUOGLU K,RANZATO M,et al.What is the best multistage architecture for object recognition? In(ICCV’09)[C]//2009 IEEE 12th Znternational Conference on Computer Vision.Kyoto,Japan:IEEE,2009.
[15]卢官明,朱海锐,郝强,等.基于深度残差网络的人脸表情识别[J].数据采集与处理,2019,34(1):50-57.