基于BP神经网络对薇甘菊预处理方法的选取

来源 :安徽农业科学 | 被引量 : 0次 | 上传用户:boblllll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要 以入侵植物薇甘菊高光谱图像为研究对象,基于4种预处理方法对薇甘菊高光谱图像进行降低噪声处理,分别研究了基于主成分分析的特征提取方法和基于BP神经网络的分类模型,筛选出薇甘菊高光谱识别的最优预处理方法,以实现薇甘菊的快速准确识别。结果显示,预处理方法为一阶、二阶微分的识别率分别为81.2%和76.92%;标准正态变量变换(SNV)和一阶微分+SG平滑的识别率分别为89.74%和87.18%。多次试验得到基于SNV预处理方法的识别率最稳定,即得到最优预处理方法为SNV。
  关键词 高光谱技术;薇甘菊目标识别;特征集选取;BP神经网络模型
  中图分类号 S126  文献标识码 A
  文章编号 0517-6611(2020)05-0246-04
  doi:10.3969/j.issn.0517-6611.2020.05.069
  开放科学(资源服务)标识码(OSID):
  Abstract With invasive plants Mikania mikania Kunt hyperspectral image as the research object,based on four kinds of pretreatment method of M.micrantha hyperspectral image noise reduction processing,we studied the feature extraction method based on principal component analysis and the classification model based on BP neural network.The optimal pretreatment method for M.micrantha hyperspectral identification was screened,in order to realize fast and exact recognition of M.micrantha.The experimental results showed that the recognition rates of first and second orders were 81.2% and 76.92%,respectively.The recognition rates of standard normal variable transformation (SNV) and first order differential +SG smoothing were 89.74% and 87.18%,respectively.Multiple experiments showed that the recognition rate of SNVbased pretreatment method was stable,in other words,the optimal pretreatment method was SNV.
  Key words Hyperspectral technology;Mikania micrantha Kunt target recognition;Feature set selection;BP neural network
  薇甘菊(Mikania micrantha Kunt)與附主植物在可见光下视觉辨识度低,分布无规律,受复杂多变的野外环境限制,一般检测方法很难实现对薇甘菊实时精准监测。人工踏查[1]是比较普遍的针对薇甘菊的监测方法之一,但其受地形影响,无法对薇甘菊的分布及危害进行准确的定量评测。由于具有光谱分辨率高、波段多、信息量丰富等特点,高光谱监测技术应用于薇甘菊入侵的监测上具有很大的优势。
  目前,监测方法主要有图像识别法、高光谱监测法、雷达数据辅助识别法和中低分辨率时序序列数据分析法等[2]。 Chance等[3]利用小型光谱成像仪(CASI)的图像,在加拿大不列颠哥伦比亚省萨里的非森林植被环境中提取喜马拉雅黑莓(Rubus armeniacus)、英国常春藤(Hedera helix)和其他物种的光谱,对所有的光谱通过光谱通道选择算法处理,结果表明对英国常青藤和喜马拉雅黑莓的检测准确率分别为80.0%和76.4%。而Narumalani等[4]对光谱图像进行去噪处理,基于光谱角匹配法检测了某区域内4种入侵物种及其分布,总体准确率为74%。
  高光谱数据降维方法主要分为2种[5]:一种是基于变换的特征提取法,即通过数据变换产生一个新的特征空间,将全部波段的特征属性完成从高维空间到低维空间转换,从而保留尽可能高的分类精度。特征提取中典型的算法有包括主成分分析(principal components analysis,PCA)[6]、奇异值分解(singular value decomposition,SVD)[7]等。另一类是基于非变换的特征选择,也称局部特征波段选取。常见的波段选择方法包括基于信息量的波段选择以及基于类间可分性的波段选择[5]。鉴于此,笔者使用主成分分析法完成特征提取,以较低的维数达到较好的识别结果,提高识别效率。
  准确地识别外来入侵植物是对其开展监测工作的前提与基础,任智伟等[5]通过将基于用PCA法和信息量改进PCA法对高光谱图像数据降维的结果输入最小距离分类器比较其分类精度来对比分析2种降维方法的效果。喻俊等[8]先利用S-Golay滤波剔除异常光谱数据,再采用光谱微分法与植被指数法构建光谱特征最后应用人工神经网络法结合因子分析法对典型植被进行分类识别。而吴培强等[9]以黄河口湿地为研究区分别建立支持向量机、人工神经网络和光谱角制图3种分类模型开展利用全波段的和所选择特征波段的分类对比试验。笔者通过成像光谱仪获取以薇甘菊为识别目标的高光谱图像,人工筛选获取薇甘菊类和非薇甘菊类高光谱数据来用作识别薇甘菊目标的研究,并基于主成分分析方法(PAC)对其做适当的降维处理。   1 薇甘菊数据的采集
  高光谱图像的采集采用人工手持德国Cubert公司生产的S185高速成像光谱仪。共采集到薇甘菊高光谱图像27张,分辨率为1 000×1 000。部分薇甘菊高光谱图像样本如图1所示。观察统计显示,样本中包括3类其他植物叶子以及其中1类植物的花,还有一些黑色背景。
  Cube Ware是与S185配套的光谱分析软件。通过易于操作的用户界面来记录和分析高光谱图像。主要用到信号即图像处理模块,即从Cube Ware中获取的高光谱数据样本的预处理,数据降维、BP神经网络模型的构建等都在Matlab 2018a中实现。
  1.1 高光谱数据样本获取
  通过Cube Ware软件打开样本集的薇甘菊高光谱图像,随机从18张图像中以像素点为单位采集高光谱数据,每个像素点对应1条高光谱曲线,每1条曲线所对应的光谱数据都能以ASCII码的格式保存(图2)。共采集到高光谱数据样本720个,该研究主要对薇甘菊进行识别,因此图片中出现的其他类植物分别记为其他类植物1,其他类植物2,其他类植物3叶子和其他类植物3叶子花,具体的样本采集数目见表1。
  在主成分分析的基础上还可以通过主成分得分图初步地对样本进行分析判别。由图5可知,薇甘菊与非薇甘菊类(图中的其他类)样本均以坐标原点为中心聚集分布,证明第一、二主成分对高光谱数据具有一定的聚类效果。比较发现,标准正态变量变换聚类效果较好。同时,各主成分得分图中非薇甘菊类样本比薇甘菊类聚集更紧密,聚类效果更明显,但2类样本间交叉重叠明显,还需要基于支持向量机分类器对其进行精确分类。
  4 BP神经网络建模
  BP(back propagation)神经网络是1986年由Rumelhart和McClelland为首的科学家提出的概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络[16]。BP神经网络是一种多层前馈,并通过误差反传训练的一种网络,其主要方法是梯度下降法,使网络的实际输出值和期望输出值的误差均方差达到最小[16]。该研究使用了BP算法信号的前向传播和误差的反向传播2个部分,计算误差输出时按从输入到输出的方向进行,而调整权值和阈值则从输出到输入的方向进行[17]。BP神经网络结构如图6所示。
  将4种预处理后的主成分作为BP神经网络的输入建立神经网络模型,并相互对比,确定最优分类准确率的预处理方法。BP神经网络建模后,进行参数调节,隐藏层均设置为10,输出层神经元个数均设置为2,而后调试隐藏层和输出层学习率、训练次数等重要参数。对神经网络的参数进行反复调整直到获得最佳分类准确率。基于4种预处理方法分别建立4个神经网络模型。建模时按2∶1分为训练集和测试集。
  从表2可以看出,基于SNV和一阶微分+SG预处理方法进行分类得到的分类准确率较优,但是就维度而言,SNV预处理方法的维度降到9,比一阶微分+S-G卷积平滑预处理方法降维程度要好。通过比较得到二阶微分对薇甘菊的识别效果最差。
  从图7和8可以看出,通过SNV方法处理过得薇甘菊数据,得到的识别程度相比于一阶微分+S-G卷积平滑的更加稳定。结合上述分析,得出基于SNV对薇甘菊的识别效果更好。并得到最优的预处理方法为SNV,且主成分个数为9时,对薇甘菊的识别效果最佳。
  5 结论
  该研究主要以外来入侵植物薇甘菊为研究对象,对野外环境下高光谱数据进行分析研究。研究了高光谱数据的异常数據样本剔除及预处理方法,基于高光谱数据降维特征提取方法,基于BP神经网络的模型建立方法。该研究得出了以下结论:
  (1)采集野外薇甘菊高光谱图像过程中,应用马氏距离剔除法剔除异常样本,分别剔除了薇甘菊类9个异常样本,以及非薇甘菊类9个异常样本,得到用于后续研究的光谱数据样本共702组,薇甘菊类351组,非薇甘菊类351组。
  (2)通过4种预处理方法对高光谱数据预处理,从而达到了降噪、消除基线漂移等预期的效果,但其对识别模型建立的影响还需要进一步验证分析。
  (3)对上述所得4个特征集分别进行了基于主成分分析法的高光谱数据降维,得到最大主成分为前25个主成分用于识别薇甘菊的特征集。比较分析显示,标准正态变量预处理方法使得高光谱数据聚类效果更好。
  (4)对降维方法降维后特征集建立基于BP神经网络分类模型。在针对主成分分析降维后的4个特征集分别建立BP神经网络分类模型,确定了4个特征集中最终的主成分数目以达到特征集进一步降维的目的,并且得出所选主成分数目对应的测试集识别准确率。其中SNV-BP对应的测试集不但识别准确率高且其所建立的BP分类模型最稳定,最终确定基于前9个主成分数目基础上测试集识别准确率最佳为89.74%,从而验证了BP神经网络能够对野外薇甘菊进行识别。
  参考文献
  [1]柳帅,林辉,孙华,等.基于Pleiades-1卫星数据薇甘菊信息提取[J].中南林业科技大学学报,2014,34(11):116-119.
  [2]孙玉芳,姜丽华,李刚,等.外来植物入侵遥感监测预警研究进展[J].中国农业资源与区划,2016,37(8):223-229.
  [3]CHANCE C M,COOPS N C,CROSBY K,et al.Spectral wavelength selection and detection of two invasive plant Species in an urban area[J].Canadian journal of remote sensing,2016,42(1):27-40.
  [4] NARUMALANI S,MISHRA D R,WILSON R,et al.Detecting and mapping four invasive species along the floodplain of North Platte River,Nebraska[J].Weed technology,2009,23(1):99-107.   [5]任智伟,吴玲达.基于信息量改进主成分分析的高光谱图像特征提取方法[J].兵器装备工程学报,2018,39(7):151-154.
  [6]张兵.高光谱图像处理与信息提取前沿[J].遥感学报,2016,20(5):1062-1090.
  [7]VILLA A,CHANUSSOT J,JUTTEN C,et al.On the use of ICA for hyperspectral image analysis[C]//2009 IEE international geoscience and remote sensing symposium.Cape Town,South Africa:IEEE,2009.
  [8]喻俊,李曉敏,张权,等.基于实测高光谱数据的太湖湖滨带典型植被分类[J].江苏农业科学,2017,45(5):240-244.
  [9]吴培强,张杰,马毅,等.基于地物光谱可分性的CHRIS高光谱影像波段选择及其分类应用[J].海洋科学,2015,39(2):20-24.
  [10]闵顺耕,李宁,张明祥.近红外光谱分析中异常值的判别与定量模型优化[J].光谱学与光谱分析,2004,24(10):1205-1209.
  [11]FILZMOSER P,HRON K.Outlier detection for compositional data using robust methods[J].Mathematical geosciences,2008,40(3):233-248.
  [12]况润元,曾帅,赵哲,等.基于实测高光谱数据的鄱阳湖湿地植被光谱差异波段提取[J].湖泊科学,2017,29(6):1485-1490.
  [13]陈彦兵,况润元,曾帅.基于高光谱数据的鄱阳湖湿地典型植被识别分析[J].人民长江,2018,49(20):19-23.
  [14]顾绍红,王永生,王光霞.主成分分析模型在数据处理中的应用[J].测绘科学技术学报,2007,24(5):387-390.
  [15]唐红,郑文斌,李宪霞.主成分分析在光全散射特征波长选择中的应用[J].光学精密工程,2010,18(8):1691-1698.
  [16]邱晨,罗璟,赵朝文,等.基于BP神经网络的空气质量模型分类预测研究[J].软件,2019,40(2):129-132.
  [17]来纯晓,武振国,金松林,等.基于 BP 神经网络的小麦抗寒性模型构建[J].河南科技学院学报(自然科学版),2019,47(3):72-78.
其他文献
摘要 [目的]通过碎枝覆盖研究,揭示林下土壤生态环境变化过程,为荔枝林碎枝覆盖技术推广提供相关数据。[方法]比较覆盖10 cm碎枝和未覆盖处理之间土壤表层温度、含水量、理化特性及肥力等土壤因子差异,分析碎枝覆盖1年后土壤理化特性及肥力的变化。[结果]荔枝枝条粉碎覆盖后土壤表层温度变化幅度较未覆盖变窄约2 ℃,使得土壤温度更加恒定。在极端气候条件下,这类效果更加显著,特别是土壤含水量。覆盖后土壤含水
期刊
摘要 [目的]建立一种简单实用的凤凰单枞茶香型分类方法。[方法]应用高效液相色谱方法研究香型不同的凤凰单枞茶的指纹图谱,采用相似度分析软件进行分析比较,获得21个识别用共有特征峰;根据相对峰面积,采用判别分析法进行分类研究,初步建立凤凰单枞茶8种香型鉴定方法。[结果]能够将参与试验的52个样品按照8个香型明显分类,正确分类率为100%。其中鸭屎香和杏仁香区分明显,证明可将鸭屎香独立于杏仁香,单独归
期刊
摘要 [目的]建立使用ICP-MS同时测定大米中铅、镉、铬、砷、汞、铝、钛、硒、镍、铁、铜、锌、钾、锰、硼、镁、锡、钠、钙、钡、锑、锶22种元素的方法。[方法]用微波消解-ICP-MS同时测定上述22种元素,试验探究更加简单有效的微波消解液,用混合内标校正基体干扰和漂移。[结果]各元素标准曲线的线性相关系数在0.999 4~0.999 9,各元素的相对标准偏差(RSD)在0.73%~11.01%,
期刊
摘要 以新疆骏枣及灰枣的干枣为研究材料,比较2种干果品质的差异并研究不同贮藏温度(4、20 ℃)对干红枣维生素C、还原糖、可滴定酸含量的影响。采用高效液相色谱串联质谱,检测其在贮藏期真菌毒素TeA的含量。结果表明,2种干果营养品质存在差异,并且2种干红枣在4 ℃下贮藏时,可以较好地抑制其维生素C和还原糖含量的下降和可滴定酸含量的升高,并且在此温度下贮藏14 d时未检测到TeA。因此,建議在4 ℃条
期刊
摘要 以切花月季“粉佳人”为试验对象,以株高、冠幅、叶长、叶宽及花枝长度等农艺生长指标进行综合考量,研究不同有机微量肥浓度和施肥方式对月季切花营养生长的影响,提高切花质量和生长效率,为高品质月季切花的栽培管理提供理论和技术支持。结果表明,根施结合叶面喷施1 500倍的施肥处理,月季株高和冠幅增长量显著高于其他处理和对照,有利于月季“粉佳人”的营养生长,对其生长发育具有促进作用。  关键词 月季切花
期刊
摘要 以薏苡黑穗病菌粉胞内蛋白为免疫原,制备抗体,建立薏苡黑穗病ELISA检测方法。结果表明,测定纯化后抗体的最高效价为1∶800 000,具特异性强;方阵试验测定抗原的最佳包被浓度为10.3 CFU/mL,抗体的工作浓度为1∶4 000;优化ELISA检测条件,确定抗体4 ℃过夜(8~12 h)包被效果最好,选择1%酪蛋白作为抗体的封闭液,抗体的最佳封闭时间为 1.5 h,抗体的最佳孵育时间为2
期刊
摘要 冰川是淡水資源的一种重要储存形式,近年来冰川面积不断减少,研究冰川面积变化对于干旱区生态保护及可持续发展意义重大。基于Landsat TM、Landsat ETM与Landsat OLI遥感影像数据以及气象观测数据,进行遥感解译与统计分析,运用决策树自动阈值分类方法,同时结合非监督分类方法得到祁连山自然保护区1995—2015年冰川面积变化,参考第2次冰川编目数据对结果进行验证,并运用相关分
期刊
摘要 随着人们消费水平的不断升级,生鲜农产品电商发展迅猛,但是相对于线下7万亿的生鲜市场规模,生鲜电商的线上渗透率仅为3%,生鲜电商被认为是电商细分行业的最后一片“蓝海”,市场潜力巨大。2018年我国生鲜农产品电商市场增长速度相比前5年呈现逐渐趋缓的态势。标准化低、品质低、品牌弱、盈利低、冷链物流不健全、营商环境不佳等因素成为阻碍生鲜电商发展的重要症结。随着国家各项重大政策利好,未来生鲜市场的线上
期刊
摘要 以广州本地木棉花为试材,使用真空冷冻干燥技术进行干燥,设置干燥时间为12、17、20、40 h,并使用单因子试剂和复合试剂进行干燥前浸泡处理,通过测定及评价干燥后花瓣的颜色、质感、厚薄度、平整性和综合效果,筛选出木棉花在真空冷冻干燥过程中适用的护色护形剂以及干燥时间,以期对干燥木棉花的大规模生产提供参考。结果表明,使用无水乙醇+10%柠檬酸复合试剂浸泡处理木棉花,真空冷冻干燥后的花朵品质最佳
期刊
摘要 收集整理湖南省地面气象观测站天气现象观测资料、典籍和新闻报道等多源信息,基于增强藤田级别建立湖南各县市1950—2015年的龙卷风EF等级序列,并进行统计分析。结果表明,湖南多地有龙卷发生,地形平坦地区多于山、丘区,洞庭湖区的常德、岳阳、益阳龙卷发生数分别居地市级的前3名,同时洞庭湖区也是较强龙卷多发地带。3—10月湖南均有龙卷发生,4—5月为高发时段,其中4月是较强龙卷多发时段;湖南龙卷发
期刊