基于卷积神经网络的农作物病害识别方法研究

来源 :安徽农业科学 | 被引量 : 0次 | 上传用户：rnimaa

【摘要】

：

【作者】

：

张乃夫谭峰范禹希

【出处】

：

安徽农业科学

【发表日期】

：

2020年5期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要传统的农作物病害诊断主要依靠人工识别，需要从业者具有一定经验且主观性较强，存在误判现象。针对这一现象，提出了一种基于卷积神经网络的农作物病害识别方法。选取玉米和马铃薯的5种常见病害进行试验，构建了1个13层的卷积神经网络结构，并分析了不同池化方式及优化算法对该模型准确性的影响。同时采用十折交叉验证对模型鲁棒性进行评估，结果表明该模型具备良好的分类性能，对5种病害的平均识别率为93.95%，为玉米及马铃薯常见病害识别提供了一种新途径。
　　关键词农作物病害;图像识别;卷积神经网络
　　中图分类号 S126 文献标识码 A 文章编号 0517-6611（2020）05-0242-04
　　doi：10.3969/j.issn.0517-6611.2020.05.068
　　开放科学（资源服务）标识码（OSID）：
　　Abstract Traditional crop disease diagnosis mainly relies on manual recognition， which requires practitioners with certain experience and strong subjectivity， and there is a phenomenon of misjudgment. Aiming at this phenomenon， we proposed a method of crop disease identification based on convolutional neural network. Five common diseases of corn and potato were selected for experiment， a 13layer convolutional neural network structure was constructed， and the influence of different pooling modes and optimization algorithms on the accuracy of the model was analyzed. At the same time， the robustness of the model was evaluated by 10fold cross validation. The results showed that the model had good classification performance and the average recognition rate of five diseases was 93.95%， which provided a new way to identify common diseases of corn and potato.
　　Key words Crop diseases;Image recognition;Convolutional neural network
　　农业作为我国国民生产生活的首要产业，为国民经济的建设与发展提供保障。农业生产中的各种农作物，如粮食作物、油料作物、蔬菜作物、饲料作物、药用作物等与人民生活有着密不可分的联系。国家统计局公布的我国粮食生产数据显示，2017年全国粮食播种面积为1.12亿hm.2，比2016年减少81.47万hm.2[1]。农业种植结构的调整优化和粮食播种面积的减少亟需对粮食单产水平进行提升。但是在农作物的生长过程中容易受微生物、细菌、病毒等侵害，导致其性状发生改变，从而严重影响作物的产量。此外，随着全球气候变化所产生的环境剧变，病害发生概率较以往大幅提升。因此，及时有效地对农作物病害进行诊治对降低病害损失和提升作物产量尤为重要。
　　作物病害识别对识别准确度有一定的要求，传统的作物病害识别方法主要是通过观察病害的形态特征来确定病害种类，并且需要检测者具有长期的种植经验和丰富的专业知识。种植者一般采用已有的经验、对照专业的书籍、查询互联网和请教农业技术人员或专家等方法。因此对病害的识别耗时费力且较为主观，并且由于作物病害症状复杂多变，部分病害特征差异并不很明显，使得人工检测方法存在一定的误判现象。我国地域广袤、作物种植面积大，因此植保专家的数量难以得到满足需求，部分地区作物发生病害时会出现专家难求的状况，导致部分作物因无法及时确诊病情從而大面积发病，使种植者遭受了巨大的经济财产损失。因此，迫切需要一种科学、快速、准确的方法来替代已有的人工检测方法，从而提高作物病害的识别效率和识别准确率。
　　近年来，卷积神经网络[2-4]受到学者们的广泛关注，由于其在训练时可以不用人为提取特征而是直接对图像进行学习，省去了病斑分割这一过程，一方面降低了特征选取的主观性，另一方面对病害识别效率有所提升，部分学者利用卷积神经网络实现了对病害的精确识别[5]。龙满生等[6]利用深度卷积神经网络AlexNet模型对大规模数据集ImageNet进行训练，并采用微调（finetune）方法进行油茶病害图像识别，结果表明该方法对油茶藻斑病、软腐病、煤污病、黄化病识别有较高的准确率。张建华等[7]提出基于改进VGG-16卷积神经网络的棉花病害识别模型，优化了VGG-16模型结构和参数，结果显示该模型对棉花病害识别具备良好的分类性能。由此可以看出卷积神经网络在图像识别中的优势。鉴于此，笔者通过对玉米及马铃薯病害识别的研究，提出1种基于卷积神经网络的病害识别方法，通过对LeNet[8]、AlexNet[9]、VGGNet[10]等经典网络结构进行学习并结合研究作物特点，构建了适用于该研究的神经网络结构，并对其结构进行优化探究，为这2种作物的害识别与防治提供了一定的科学方法和依据。　　1 材料与方法
　　1.1 试验数据及预处理
　　1.1.1 病害图像采集。以玉米及马铃薯常见病害为研究对象，分别采集了玉米灰斑病、玉米锈病、玉米枯叶病、马铃薯早疫病、马铃薯晚疫病5类病害样本进行试验，图像来源于植物村（Plant village）、美国植物病例协会（APS Net）等植物病害网站，其中共采集玉米灰斑病图像191张、玉米锈病图像519张、玉米枯叶病图像374张、马铃薯早疫病图像412张，马铃薯晚疫病图像380张，分别用病害首字母缩写HB（灰斑病）、XB（锈病）、KY（枯叶病）、ZY（早疫病）、WY（晚疫病）表示对应病害类别标签，采集到的部分图像如图1所示。
　　1.1.2 病害图像预处理。由于采集到的作物病害图片大小不一致，在含有全连接层的神经网络结构训练时，需要预先对采集到的图像进行resize处理，从而固定其输入维度。若不进行该操作则会导致全连接层的参数维度与前一层的特征图维度不一致进而导致训练提前结束[11]。所以该试验首先利用python的图形处理模块（PIL）对所采集到的病害图片进行归一化处理，将样本图片尺寸统一裁剪为像素128×128，便于作为卷积神经网络的输入。
　　同时，试验采集到的不同种类病害样本数目有一定差距，样本数目的不均衡往往会导致试验结果偏向样本数目较多的一类，为防止这一问题的发生对数据集进行了扩充。对采集到的小样本病害数据利用PIL模块进行了数据增强（data augmentation），对小样本病害数据进行了旋转操作，旋转角度分别为90°、180°、270°，将旋转后的图片存入相应的训练文件夹内，这就使得扩充完成后样本数目相差不大，降低了模型过拟合的风险。
　　1.2 试验方法
　　1.2.1 卷积神经网络。卷积神经网络一般由输入层（input layer）、卷积层（convolutional layer）、池化层（pooling layer）、全连接层（fully connected layer）和输出层（output layer）等组成。卷积层由若干个卷积单元组成，每个卷积单元的参数都是通过反向传播算法优化得到。卷积过程通过卷积核对输入图像进行卷积操作，其目的是提取图像的局部特征，从而得到多个特征图（feature map）。对于卷积层当采用方式SAME方式作为边界补充条件时，其卷积后特征图尺寸计算公式为：
　　池化层又叫下采样层（down sampling layer），由于图像在卷积层进行卷积操作之后会得到维度很大的特征，所以通常采用池化层对卷积后提取到的特征信息进行降维处理，以此减少网络参数来降低模型的计算量，降低过拟合的风险。全连接层（fully connected layer）在神经网络中主要起到“分类器”的作用，通过将输入图片的特征通过线性变换映射到样本标记空间，从而实现由图片转化为向量这一过程。
　　1.2.2 模型结构设计。通过学习LeNet、AlexNet、VGGNet等知名网络结构后，构建了一个13层的卷积神经网络结构，包含5个卷积层、5个池化层、2个全连接层和1个输出层。该模型结构如图2所示。
　　由图2可知，输入层图片尺寸为128×128，卷积过程作均进行补零操作，使得卷积后的图像尺寸与卷积前保持一致同时也降低了边缘数据丢失的问题。卷积层一和卷积层二使用尺寸为5×5的卷积核对输入图片进行卷积，分别得到32个feature maps和64个feature maps，每层对应特征图尺寸为64×64和32×32。卷积层三、四、五使用尺寸为3×3的卷积核对输入图片进行卷积，分别得到128个feature maps、256个feature maps和512个feature maps，每层对应特征图尺寸为16×16、8×8和4×4。
　　池化层均采用尺寸为2×2的核对卷积层输入进来的图片进行下采样，试验分别选取均值池化（average-pooling）、最大值池化（max-pooling）为池化方式。均值池化即选取图像区域内的平均值作为池化后输出结果，最大值池化通过选取图像区域内的最大值作为池化输出结果[12]。由于均值池化能更好的对图像背景信息进行保留而最大值池化能更好的保留图像的纹理信息，所以该试验对这2种池化方式进行探究，分析不同池化方式对模型准确率的影响。
　　该模型激活函数最终采用非线性激活函数ReLu，与传统的Sigmoid函数及Tanh函数相比ReLu函数具有单侧抑制的效果，通过使部分神经元输出为0从而使网络具有一定的稀疏性，降低了模型参数的同时减少了模型所需要的计算量，使模型收敛速度更快[14]。
　　2 结果与分析
　　2.1 池化方式对识别率的影响
　　该试验设置将所有样本训练30次，batch size为64，初始学习率（learning rate）為0.001，所有卷积层采用ReLU作为激活函数，为了避免过拟合现象的发生，设置正则化系数为0.005，试验采用单一变量原则即在对比试验中每次只改变其中1个变量，从而排除其他因素对结果的影响。试验首先比较了不同池化方式对模型准确率的影响，其结果如表1所示。由表1可知，采用最大池化方式和平均池化方式时模型对病害识别均有较高的准确率，其中采用平均池化方式时训练集和测试集的准确率较高（93.12%、91.25%），而采用最大值池化方式时准确率略微低于平均池化（92.18%、86.56%），可以看出该研究设计的病害识别模型采用平均池化方式效果更好。
　　2.2 不同优化算法对识别率的影响
　　卷积神经网络模型中含有大量的参数，对于这些参数学者们提出了众多算法来对其进行优化，为探究不同优化算法对病害识别准确率的影响，试验设计采用AdaGrad、Adam、RMSProp共3种优化算法。AdaGrad、Adam、RMSProp算法的学习率都是自适应的，即在训练的过程中根据参数出现频率自动的调整学习率。AdaGrad算法利用学习率与历史梯度的平方根比值作为当前训练的学习率，并且针对不同的变量参数允许使用不同的学习率进行优化。RMSProp算法可以消除梯度下降中的摆动，并允许使用1个更大的学习率来加快算法的学习速度。Adam是另一种学习率自适应优化算法，通过计算梯度的一阶矩估计和二阶矩估计来自适应学习率。　　在模型训练的中末期由于迭代次数的增加，其梯度平方不断增大，即Gi，t不断增大，由公式可知当Gi，t很大时会导致学习率趋近于无穷小，这样就使得模型无法从图片中提取出更多的信息，出现模型准确率低的情况。而Adam算法可以看成对RMSProp算法的进一步优化，将momentum的与之结合，不仅仅考虑当前的梯度，还会考虑之前的累计梯度，使模型达到更好的效果。
　　2.3 模型鲁棒性分析
　　在进行神经网络模型训练时，单一测试集可能会具有偶然性和随机性。因此为了验证模型的稳定性和准确性，试验采用K折交叉验证（K-fold cross-validation）对模型进行评价，将作物病害图片分为K份，依次将其中K-1份作为训练集用于网络的训练，剩余1份作为测试集进行模型测试，交叉重复验证K次使得每份样本都被验证1次，综合K次实验后得到的结果均值对模型的鲁棒性进行评价[15]。对于试验则采用常用的十折交叉验证方法来对模型的鲁棒性进行评价，1～10次试验测试集平均识别准确率依次为93.43%、94.37%、95.31%、94.68%、92.81%、94.06%、93.12%、92.50%、95.00%、94.27%;10次试验模型准确率最高为95.31%，最低为92.50%，试验模型平均准确率为93.95%，综合10次试验结果来看，模型准确率相差不大，由此可以证明该试验模型的可靠性。
　　3 结论
　　作物病害识别一直是机器学习中的一个热门话题，传统的作物病害识别主观性较高存在一定误判现象，利用图像处理技术和模式识别方式对作物病害进行识别虽然有良好的表现，但是在特征的选取上较为复杂同时难以提取图像中的深层特征[5-10]。所以试验设计了一个卷积神经网络模型，避免了人为提取特征的复杂性，提升病害识别效率，同时选取马铃薯及玉米的常见病害作为试验研究对象，试验研究的主要结论如下：①利用卷积神经网络对玉米灰斑病、玉米锈病、玉米枯叶病、马铃薯早疫病、马铃薯晚疫病进行了识别，试验构建了一个13层的神经网络模型，结果表明该模型对上述5种病害能进行有效地识别，且平均识别准确率在90%以上。②在该模型的基础上比较分析了不同池化方式对模型准确率产生的影响，分别利用最大值池化和均值池化进行试验对比，结果表明采用均值池化的准确率要高于最大值池化的准确率。③试验选择了AdaGrad、RMSProp、Adam共3种优化算法进行对比试验，分析试验结果得出，试验模型采用Adam优化算法时其训练集准确率为93.12%，高于AdaGrad算法（84.44%）和RMSProp算法（91.25%），并且對该模型进行了十折交叉验证，结果表明该模型鲁棒性较好。
　　参考文献
　　[1]国家统计局.中国统计年鉴2018[M].北京：中国统计出版社，2018.
　　[2]周飞燕，金林鹏，董军.卷积神经网络研究综述[J].计算机学报，2017，40（6）：1229-1251.
　　[3]陈先昌.基于卷积神经网络的深度学习算法与应用研究[D].杭州：浙江工商大学，2014.
　　[4]常亮，邓小明，周明全，等.图像理解中的卷积神经网络[J].自动化学报，2016，42（9）：1300-1312.
　　[5]姜珊.基于卷积神经网络的水稻生长阶段优劣长势判别的研究[D].大庆：黑龙江八一农垦大学，2018.
　　[6]龙满生，欧阳春娟，刘欢，等.基于卷积神经网络与迁移学习的油茶病害图像识别[J].农业工程学报，2018，34（18）：194-201.
　　[7]张建华，孔繁涛，吴建寨，等.基于改进VGG卷积神经网络的棉花病害识别模型[J].中国农业大学学报，2018，23（11）：161-171.
　　[8]LECUN Y，BOTTOU L，BENGIO Y，et al.Gradientbased learning applied to document recognition[J].Proceedings of the IEEE，1998，86（11）：2278-2324.
　　[9]KRIZHEVSKY A，SUTSKEVER I，HINTON G E.ImageNet classification with deep convolutional neural networks[J].Advances in neural information processing systems，2012，25（2）：1097-1105.
　　[10]SIMONYAN K，ZISSERMAN A.Very deep convolutional networks for largescale image recognition[R].2014：1409-1556.
　　[11]LONG J，SHELHAMER E，DARRELL T.Fully Convolutional networks for semantic segmentation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence，2014，39（4）：640-651.
　　[12]杨东坡.基于深度学习的商品图像分类[D].大连：大连交通大学，2015.
　　[13]池燕玲.基于深度学习的人脸识别方法的研究[D].福州：福建师范大学，2015.
　　[14]JARRETT K，KAVUKCUOGLU K，RANZATO M，et al.What is the best multistage architecture for object recognition？ In（ICCV’09）[C]//2009 IEEE 12th Znternational Conference on Computer Vision.Kyoto，Japan：IEEE，2009.
　　[15]卢官明，朱海锐，郝强，等.基于深度残差网络的人脸表情识别[J].数据采集与处理，2019，34（1）：50-57.

其他文献

不同贮藏温度对新疆骏枣和灰枣干果品质的影响

摘要以新疆骏枣及灰枣的干枣为研究材料，比较2种干果品质的差异并研究不同贮藏温度（4、20 ℃）对干红枣维生素C、还原糖、可滴定酸含量的影响。采用高效液相色谱串联质谱，检测其在贮藏期真菌毒素TeA的含量。结果表明，2种干果营养品质存在差异，并且2种干红枣在4 ℃下贮藏时，可以较好地抑制其维生素C和还原糖含量的下降和可滴定酸含量的升高，并且在此温度下贮藏14 d时未检测到TeA。因此，建議在4 ℃条

期刊

有机微量元素生长肥对月季“粉佳人”营养生长的影响

摘要以切花月季“粉佳人”为试验对象，以株高、冠幅、叶长、叶宽及花枝长度等农艺生长指标进行综合考量，研究不同有机微量肥浓度和施肥方式对月季切花营养生长的影响，提高切花质量和生长效率，为高品质月季切花的栽培管理提供理论和技术支持。结果表明，根施结合叶面喷施1 500倍的施肥处理，月季株高和冠幅增长量显著高于其他处理和对照，有利于月季“粉佳人”的营养生长，对其生长发育具有促进作用。　　关键词月季切花

期刊

薏苡黑穗病快速检测方法研究

摘要以薏苡黑穗病菌粉胞内蛋白为免疫原，制备抗体，建立薏苡黑穗病ELISA检测方法。结果表明，测定纯化后抗体的最高效价为1∶800 000，具特异性强;方阵试验测定抗原的最佳包被浓度为10.3 CFU/mL，抗体的工作浓度为1∶4 000;优化ELISA检测条件，确定抗体4 ℃过夜（8～12 h）包被效果最好，选择1%酪蛋白作为抗体的封闭液，抗体的最佳封闭时间为 1.5 h，抗体的最佳孵育时间为2

期刊

冰川与气候变化相关性分析

摘要冰川是淡水資源的一种重要储存形式，近年来冰川面积不断减少，研究冰川面积变化对于干旱区生态保护及可持续发展意义重大。基于Landsat TM、Landsat ETM与Landsat OLI遥感影像数据以及气象观测数据，进行遥感解译与统计分析，运用决策树自动阈值分类方法，同时结合非监督分类方法得到祁连山自然保护区1995—2015年冰川面积变化，参考第2次冰川编目数据对结果进行验证，并运用相关分

期刊

新零售背景下生鲜农产品电商的发展路径研究

摘要随着人们消费水平的不断升级，生鲜农产品电商发展迅猛，但是相对于线下7万亿的生鲜市场规模，生鲜电商的线上渗透率仅为3%，生鲜电商被认为是电商细分行业的最后一片“蓝海”，市场潜力巨大。2018年我国生鲜农产品电商市场增长速度相比前5年呈现逐渐趋缓的态势。标准化低、品质低、品牌弱、盈利低、冷链物流不健全、营商环境不佳等因素成为阻碍生鲜电商发展的重要症结。随着国家各项重大政策利好，未来生鲜市场的线上

期刊

木棉花真空冷冻干燥过程中护色护形剂的筛选

摘要以广州本地木棉花为试材，使用真空冷冻干燥技术进行干燥，设置干燥时间为12、17、20、40 h，并使用单因子试剂和复合试剂进行干燥前浸泡处理，通过测定及评价干燥后花瓣的颜色、质感、厚薄度、平整性和综合效果，筛选出木棉花在真空冷冻干燥过程中适用的护色护形剂以及干燥时间，以期对干燥木棉花的大规模生产提供参考。结果表明，使用无水乙醇+10%柠檬酸复合试剂浸泡处理木棉花，真空冷冻干燥后的花朵品质最佳

期刊

湖南龙卷发生规律

摘要收集整理湖南省地面气象观测站天气现象观测资料、典籍和新闻报道等多源信息，基于增强藤田级别建立湖南各县市1950—2015年的龙卷风EF等级序列，并进行统计分析。结果表明，湖南多地有龙卷发生，地形平坦地区多于山、丘区，洞庭湖区的常德、岳阳、益阳龙卷发生数分别居地市级的前3名，同时洞庭湖区也是较强龙卷多发地带。3—10月湖南均有龙卷发生，4—5月为高发时段，其中4月是较强龙卷多发时段;湖南龙卷发

期刊

基于BP神经网络对薇甘菊预处理方法的选取

摘要以入侵植物薇甘菊高光谱图像为研究对象，基于4种预处理方法对薇甘菊高光谱图像进行降低噪声处理，分别研究了基于主成分分析的特征提取方法和基于BP神经网络的分类模型，筛选出薇甘菊高光谱识别的最优预处理方法，以实现薇甘菊的快速准确识别。结果显示，预处理方法为一阶、二阶微分的识别率分别为81.2%和76.92%;标准正态变量变换（SNV）和一阶微分+SG平滑的识别率分别为89.74%和87.18%。多

期刊

陕北山地苹果“大小年”现象的成因及修剪防御措施

摘要陕北丘陵沟壑区是陕西省新发展的山地苹果生产基地，但山地苹果“大小年”严重。山地苹果“大小年”不但与树体营养、内源激素、气候环境等密切相关，而且与土壤水肥管理、修剪、疏花疏果、病虫防治、品种特性及授粉树配置等密切相关。针对山地苹果“大小年”的问题，简述了“大年”“小年”树的冬季修剪、花前复剪、疏花疏果及夏季、秋季修剪方法，以防止、减少“大小年”发生，促进山地苹果丰产稳产。　　关键词山地苹果;

期刊

农田水利学课程教学改革探索

摘要针对滁州学院农田水利学课程教学中存在的课程内容陈旧、教学方法单一、考核方式薄弱等问题，从教学内容、教学方法及考核方式等方面提出了相应的改进措施，旨在为提升滁州学院农田水利课程的教学质量，同时也为其他高校农田水利学课程的教学改革提供有益参考。　　关键词农田水利学;教学改革;课程内容;教学方法;考核方式　　中图分类号 S-01;G64 文献标识码 A 文章编号 0517-6611（2020）0

期刊

基于卷积神经网络的农作物病害识别方法研究

其他学术论文