论文部分内容阅读
摘要:为了预测土壤pH值和全钾含量,采集111个土壤样本的高光谱信息,采用小波变换后去包络的方法对原始光谱信息进行预处理,利用相关性分析法选择土壤光谱特征波段,进行偏最小二乘法回归(PLSR)、主成分分析回归(PCR)、支持向量回归(SVR)3种方法的土壤pH值和全钾含量高光谱反演精度的比较研究。结果显示,在水稻土和紫色土全钾含量和水稻土pH值的反演中,SVR方法都取得了比PLSR方法和PCR方法更好的反演效果。在紫色土pH值反演中,PLSR方法和PCR方法反演效果均优于SVR方法。比较不同类型土壤和不同土壤参数的反演效果发现,水稻土土壤pH值和全钾含量的反演效果均强于紫色土,全钾含量的反演效果优于pH值。本研究结果说明高光谱快速反演土壤pH值和全钾含量具有可行性。
关键词:支持向量回归;pH值;全钾含量;高光谱反演
中图分类号:TP79文献标识码:A文章编号:1000-4440(2020)01-0092-07
Abstract:In order to predict soil pH value and total potassium content, hyperspectral information of 111 soil samples was collected. The original spectral information was pretreated by continuum removal after wavelet transform. The characteristic bands of soil spectra were selected by correlation analysis method. A comparative study on hyperspectral inversion accuracy of soil pH and total potassium content was carried out by using partial least squares regression (PLSR), principal component analysis regression (PCR) and support vector regression (SVR). SVR method was better than PLSR method in the inversion of total potassium content of paddy soil and purple soil and pH value of paddy soil and PCR method in the inversion of total potassium content of paddy soil and purple soil and pH value of paddy soil. In the inversion of pH value of purple soil, the inversion results of PLSR method and PCR method were better than those of SVR method. Comparing the inversion models of different types of soil and different soil parameters, the inversion results of pH value and total potassium content of paddy soil were stronger than those of purple soil, and the inversion effect of total potassium content was better than that of pH value. THese results of this study indicate that it is feasible to retrieve soil pH value and total potassium content by hyperspectral method.
Key words:support vector regression;pH value;total potassium content;hyperspectral inversion
土壤中的pH值和全钾(TK)含量是影响作物生长的重要因素[1]。利用高光谱反演土壤理化性质可以快速、准确地获得土壤的pH值、全钾含量,极大地节省人力和物力,為土壤性质研究提供了一个新的途径和方法[2]。
基于高光谱的土壤性质反演研究中,如何选用合适的反演方法,提高土壤性质的预测精度是一个重要的研究方向。目前基于高光谱的土壤性质反演方法主要包括多元线性回归(Multivariate linear regression,MLR)、偏最小乘法回归 (Partial least squares regression,PLSR)、主成分回归(Principle component regression,PCR)、人工神经网络(Artificial neural network,ANN) 、支持向量机(Support vector machine,SVM)、回归树(Regression tree,BT)、随机森林(Random forest ,RF)、多元自适应回归样条(Multivariate adaptive regression splines ,MARS)[3-4]等。由于方法复杂难以解释,对数据量要求很大等原因,在一定程度上限制了ANN、BT、MARS等方法的应用范围[4]。PCR方法在利用高光谱技术反演江西省万安县脐橙果园的土壤全钾含量方面具有一定的优势,建模相关系数可达到0.966[4]。江西省兴国县的黄绵土土壤全钾含量预测方法比较研究中发现,对于土壤全钾含量的预测,MLR方法的效果优于PLSR方法,但是对于速效钾,PLSR方法的拟合效果优于MLR方法(R2为0.681)[5]。对山东省齐河县的潮土速效钾的研究中,PLSR方法也取得了良好的拟合效果,决定系数R2为0.976[6]。对呼伦贝尔干旱半干旱土壤地区进行土壤pH值光谱特性和反演研究中发现,SVR方法比PLSR方法的预测效果(R2分别为0.910和0.890)更好[7]。但PLSR方法在预测陕西关中地区的塿土pH值时的决定系数为0.995[8],其值高于SVR方法的决定系数。土壤属性预测方法种类繁多且各具优势,如PLSR方法是MLR方法和PCA方法的有机结合,一般用于数据小,但是变量维数比较大,且相关性较大的样本。PCR方法通过主成分分析降低元素之间的共线性,选择几个不相关的变量作为PCR方法的独立变量进行建模,可以很好地降低方法的运算量,提高拟合效果。SVR方法能够使用大量的核密度函数,解决非线性化的问题,适用范围广,鲁棒性强,是小样本估计预测的最佳理论方法。但由于土壤类型、母质、土地利用等因素及测量光谱时的条件差异,使得难以找到一种通用的反演方法能在所有土壤性质预测中取得较高的精度。因此,对于不同地区获得的光谱数据,仍需要通过方法的比较来确定最适的方法,以便提高土壤性质的反演精度。 西南地區由于特殊的地质构造造就了生态坏境的脆弱性,土壤退化情况严重。快速、省力地测定西南地区土壤中的pH值和全钾含量,对改善西南地区土壤退化具有重要意义。但基于高光谱技术对西南地区的土壤pH值和全钾含量的反演鲜有人研究。
因此,本研究拟分别用PLSR、PCR、SVR 3种方法对三峡库区王家沟小流域的紫色土、水稻土土壤的pH值、全钾含量进行高光谱反演。通过对3种方法的比较分析,从中选择最优方法,以期提高土壤pH和全钾含量的反演精度,为土壤pH值和全钾含量的快速预测提供理论依据。
1材料与方法
1.1研究区概况
本研究所选择的研究区为重庆市涪陵区珍溪镇东部王家沟小流域区域,地理位置为E107°29′~ E107°31′,N29°53′~N29°54′。该区域为三峡库区典型的农业小流域区域,总面积为257.91 hm2。研究区地处四川盆地和山地过渡地带,地貌以丘陵为主,地势自北向南逐渐降低,属于亚热带季风气候区,土壤类型为紫色土和水稻土。研究区的土地利用类型较为复杂,具有较长农业耕作历史。主要的土地利用类型为林地、菜地、农作物耕地、旱地、少量未被利用的荒地以及少量民用地。该流域主要农作物为水稻、玉米和榨菜,上半年主要以种植水稻和玉米为主,下半年主要种植榨菜。由于耕地的零星分布,当地农业耕作方式仍然保持原始人工耕作方式,大型机械耕作较少[9]。三峡库区王家沟小流域农业结构类型具有西南地区农业的典型性,针对该区域土壤中的pH值和全钾含量高光谱反演进行研究,具有区域代表性。
1.2土样采集与制备
对研究区域内的耕地土壤进行多点混合采样,如图1,共采集紫色土和水稻土土壤样本111个。采集的土壤样本依次进行编号,带回实验室自然风干、碾碎,除去土壤中的杂质,然后过100目尼龙筛混合均匀。每个土壤样本分成2份,分别用于实验室化学分析测定土样中的pH值、全钾含量以及光谱测量。pH采用水浸(1∶1,质量比)电极法进行测量,土壤全钾含量采用氢氧化钠熔融——火焰光度法[10]。水稻土和紫色土土壤样本的pH值与全钾含量统计参数如表 1所示。水稻土土壤pH值为4.400~8.100,紫色土pH值为4.600~8.100,水稻土和紫色土酸碱度的变化范围较为一致。水稻土土壤全钾含量为11.200~21.100 g/kg,平均值为17.550 g/kg。紫色土全钾含量为6.800~22.700 g/kg,平均值为17.738 g/kg,紫色土全钾含量的平均值略高于水稻土。水稻土全钾含量的变异系数低于紫色土全钾含量的变异系数,可能原因是农户在此类型土壤中施肥较多[11],影响了全钾含量。pH在水稻土和紫色土的变异系数大致相同,说明该研究区域土壤的酸碱性差别不大。紫色土和水稻土的pH值和全钾含量的变异系数均属于中等程度的变异。
1.3光谱反射率的测定及预处理
1.3.1光谱反射率的测定利用FieldSpec Pro FR 野外光谱仪对土样光谱数据进行采集,仪器测定波长为350~2 500 nm,350~1 000 nm波段的采样间隔为1.4 nm,光谱分辨率为3 nm,1 000~2 500 nm的采样间隔为2.0 nm,光谱分辨率为10 nm[11]。土壤光谱测量在暗室进行,暗室内灯源高度130 cm,将ASD探头稳定在三脚架上,距离3 cm的位置垂直扫描土壤样品,以50°的俯角照射土样,测量前进行白板定标,重复采集10次光谱数据,选择平均值作为其原始光谱。
1.3.2光谱数据预处理FieldSpec Pro FR 野外光谱仪测定不同波段使用的探测元件不同,可能造成光谱的测量偏差,在光谱分析仪器上对原始光谱进行断点拟合[12],边缘波段350~399 nm和2 450~2 500 nm 2段数据受外界噪音影响较大,将其剔除[13](图2)。保留其余波段(400~2 449 nm)数据作为土样的实际光谱反射数据[12]。利用R语言软件的Wavelet程序包中的Least Asymetric类型小波函数[14],对实际光谱反射数据进行4层分解,通过小波分解舍去小波高频系数从而进行小波去噪变换[15],再通过R语言软件中的Prospectr 程序包中的Continuum removal 功能分别对紫色土、水稻土样本光谱数据进行去包络线处理[16](图3)。图2中,土壤样本的反射和吸收特征并不明显。经过小波变换和去包络预处理后,土壤样本具有明显的反射和吸收特征:在400~2 449 nm中有4个明显的吸收谷,吸收谷波长位置分别大概位于515 nm、1 405 nm、1 915 nm和2 210 nm。
1.4建模方法及精度评价指标
1.4.1土壤pH值、全钾含量高光谱预测方法PCR方法是通过主成分分析的方法选择多个变量中影响因素较大的几个主要变量进行降维,根据得分系数矩阵将原变量代回得到新的方法[16]。PLSR方法与主成分回归有关,但不是寻找响应和独立变量之间最小方差的超平面,而是通过投影预测变量和观测变量到一个新空间来寻找一个线性回归的方法[17]。SVR方法主要是通过升维后,在高维空间中构造线性决策函数来实现线性回归,用e不敏感函数,其基础主要是e不敏感函数和核函数算法[18]。
分别从紫色土土壤样本和水稻土土壤样本中按RS(Random sample)样本集划分方法选择1/3样本数据作为验证集,2/3样本数据作为标定集。紫色土土壤的标定集和验证集的样本数分别为52和26;水稻土土壤样本标定集和验证集的样本数分别为22和11。小波分析后去包络线反射率作为输入量,分别采用PLR、PCR、SVR 3种方法对紫色土、水稻土pH值和全钾含量进行反演。其中PLSR、PCR、SVR 3种方法是用The UnscreamblerX10.5软件实现的。
2结果与分析 2.1土壤pH值、全钾含量与光谱反射率的相关性分析
对预处理后的水稻土、紫色土土壤样本光谱反射率分别与土壤pH、全钾含量进行相关性统计,结果如图4~图7所示。从图中可以看出,水稻土土壤预处理后的光谱反射率与pH值的相关系数范围为-0.621~0.524(图4),相关系数最大绝对值出现在波长1 100 nm处。预处理后的紫色土光谱反射率与pH值的相关系数范围为-0.589~0.441(图5),相关系数最大绝对值出现在波长1 146 nm处。对于紫色土和水稻土2种不同土壤类型,其光谱反射率与pH之间都在近红外1 100 nm左右的波段出现了最大相关系数绝对值。
水稻土全钾含量与预处理后的光谱反射率的相关系数范围为-0.671~0.576(图6)。541 nm波段的反射率与水稻土土壤全钾含量表现出了最强的负相关,其相关系数值为-0.671。紫色土全钾含量与预处理后光谱反射率的相关系数范围为-0.727~0.494(图7),最大相关系数绝对值出现在波长517 nm处。紫色土全钾含量与预处理后的光谱反射率的最大相关系数与水稻土不同,但二者均在绿波段表现出了极强的负相关。
2.2土壤pH值和全钾含量的反演方法及效果评价
2.2.1土壤pH值的反演方法对土壤光谱数据进行预处理后,利用SPSS软件对土壤pH值与土壤反射光谱进行相关性分析,并进行显著性检验。在通过P
关键词:支持向量回归;pH值;全钾含量;高光谱反演
中图分类号:TP79文献标识码:A文章编号:1000-4440(2020)01-0092-07
Abstract:In order to predict soil pH value and total potassium content, hyperspectral information of 111 soil samples was collected. The original spectral information was pretreated by continuum removal after wavelet transform. The characteristic bands of soil spectra were selected by correlation analysis method. A comparative study on hyperspectral inversion accuracy of soil pH and total potassium content was carried out by using partial least squares regression (PLSR), principal component analysis regression (PCR) and support vector regression (SVR). SVR method was better than PLSR method in the inversion of total potassium content of paddy soil and purple soil and pH value of paddy soil and PCR method in the inversion of total potassium content of paddy soil and purple soil and pH value of paddy soil. In the inversion of pH value of purple soil, the inversion results of PLSR method and PCR method were better than those of SVR method. Comparing the inversion models of different types of soil and different soil parameters, the inversion results of pH value and total potassium content of paddy soil were stronger than those of purple soil, and the inversion effect of total potassium content was better than that of pH value. THese results of this study indicate that it is feasible to retrieve soil pH value and total potassium content by hyperspectral method.
Key words:support vector regression;pH value;total potassium content;hyperspectral inversion
土壤中的pH值和全钾(TK)含量是影响作物生长的重要因素[1]。利用高光谱反演土壤理化性质可以快速、准确地获得土壤的pH值、全钾含量,极大地节省人力和物力,為土壤性质研究提供了一个新的途径和方法[2]。
基于高光谱的土壤性质反演研究中,如何选用合适的反演方法,提高土壤性质的预测精度是一个重要的研究方向。目前基于高光谱的土壤性质反演方法主要包括多元线性回归(Multivariate linear regression,MLR)、偏最小乘法回归 (Partial least squares regression,PLSR)、主成分回归(Principle component regression,PCR)、人工神经网络(Artificial neural network,ANN) 、支持向量机(Support vector machine,SVM)、回归树(Regression tree,BT)、随机森林(Random forest ,RF)、多元自适应回归样条(Multivariate adaptive regression splines ,MARS)[3-4]等。由于方法复杂难以解释,对数据量要求很大等原因,在一定程度上限制了ANN、BT、MARS等方法的应用范围[4]。PCR方法在利用高光谱技术反演江西省万安县脐橙果园的土壤全钾含量方面具有一定的优势,建模相关系数可达到0.966[4]。江西省兴国县的黄绵土土壤全钾含量预测方法比较研究中发现,对于土壤全钾含量的预测,MLR方法的效果优于PLSR方法,但是对于速效钾,PLSR方法的拟合效果优于MLR方法(R2为0.681)[5]。对山东省齐河县的潮土速效钾的研究中,PLSR方法也取得了良好的拟合效果,决定系数R2为0.976[6]。对呼伦贝尔干旱半干旱土壤地区进行土壤pH值光谱特性和反演研究中发现,SVR方法比PLSR方法的预测效果(R2分别为0.910和0.890)更好[7]。但PLSR方法在预测陕西关中地区的塿土pH值时的决定系数为0.995[8],其值高于SVR方法的决定系数。土壤属性预测方法种类繁多且各具优势,如PLSR方法是MLR方法和PCA方法的有机结合,一般用于数据小,但是变量维数比较大,且相关性较大的样本。PCR方法通过主成分分析降低元素之间的共线性,选择几个不相关的变量作为PCR方法的独立变量进行建模,可以很好地降低方法的运算量,提高拟合效果。SVR方法能够使用大量的核密度函数,解决非线性化的问题,适用范围广,鲁棒性强,是小样本估计预测的最佳理论方法。但由于土壤类型、母质、土地利用等因素及测量光谱时的条件差异,使得难以找到一种通用的反演方法能在所有土壤性质预测中取得较高的精度。因此,对于不同地区获得的光谱数据,仍需要通过方法的比较来确定最适的方法,以便提高土壤性质的反演精度。 西南地區由于特殊的地质构造造就了生态坏境的脆弱性,土壤退化情况严重。快速、省力地测定西南地区土壤中的pH值和全钾含量,对改善西南地区土壤退化具有重要意义。但基于高光谱技术对西南地区的土壤pH值和全钾含量的反演鲜有人研究。
因此,本研究拟分别用PLSR、PCR、SVR 3种方法对三峡库区王家沟小流域的紫色土、水稻土土壤的pH值、全钾含量进行高光谱反演。通过对3种方法的比较分析,从中选择最优方法,以期提高土壤pH和全钾含量的反演精度,为土壤pH值和全钾含量的快速预测提供理论依据。
1材料与方法
1.1研究区概况
本研究所选择的研究区为重庆市涪陵区珍溪镇东部王家沟小流域区域,地理位置为E107°29′~ E107°31′,N29°53′~N29°54′。该区域为三峡库区典型的农业小流域区域,总面积为257.91 hm2。研究区地处四川盆地和山地过渡地带,地貌以丘陵为主,地势自北向南逐渐降低,属于亚热带季风气候区,土壤类型为紫色土和水稻土。研究区的土地利用类型较为复杂,具有较长农业耕作历史。主要的土地利用类型为林地、菜地、农作物耕地、旱地、少量未被利用的荒地以及少量民用地。该流域主要农作物为水稻、玉米和榨菜,上半年主要以种植水稻和玉米为主,下半年主要种植榨菜。由于耕地的零星分布,当地农业耕作方式仍然保持原始人工耕作方式,大型机械耕作较少[9]。三峡库区王家沟小流域农业结构类型具有西南地区农业的典型性,针对该区域土壤中的pH值和全钾含量高光谱反演进行研究,具有区域代表性。
1.2土样采集与制备
对研究区域内的耕地土壤进行多点混合采样,如图1,共采集紫色土和水稻土土壤样本111个。采集的土壤样本依次进行编号,带回实验室自然风干、碾碎,除去土壤中的杂质,然后过100目尼龙筛混合均匀。每个土壤样本分成2份,分别用于实验室化学分析测定土样中的pH值、全钾含量以及光谱测量。pH采用水浸(1∶1,质量比)电极法进行测量,土壤全钾含量采用氢氧化钠熔融——火焰光度法[10]。水稻土和紫色土土壤样本的pH值与全钾含量统计参数如表 1所示。水稻土土壤pH值为4.400~8.100,紫色土pH值为4.600~8.100,水稻土和紫色土酸碱度的变化范围较为一致。水稻土土壤全钾含量为11.200~21.100 g/kg,平均值为17.550 g/kg。紫色土全钾含量为6.800~22.700 g/kg,平均值为17.738 g/kg,紫色土全钾含量的平均值略高于水稻土。水稻土全钾含量的变异系数低于紫色土全钾含量的变异系数,可能原因是农户在此类型土壤中施肥较多[11],影响了全钾含量。pH在水稻土和紫色土的变异系数大致相同,说明该研究区域土壤的酸碱性差别不大。紫色土和水稻土的pH值和全钾含量的变异系数均属于中等程度的变异。
1.3光谱反射率的测定及预处理
1.3.1光谱反射率的测定利用FieldSpec Pro FR 野外光谱仪对土样光谱数据进行采集,仪器测定波长为350~2 500 nm,350~1 000 nm波段的采样间隔为1.4 nm,光谱分辨率为3 nm,1 000~2 500 nm的采样间隔为2.0 nm,光谱分辨率为10 nm[11]。土壤光谱测量在暗室进行,暗室内灯源高度130 cm,将ASD探头稳定在三脚架上,距离3 cm的位置垂直扫描土壤样品,以50°的俯角照射土样,测量前进行白板定标,重复采集10次光谱数据,选择平均值作为其原始光谱。
1.3.2光谱数据预处理FieldSpec Pro FR 野外光谱仪测定不同波段使用的探测元件不同,可能造成光谱的测量偏差,在光谱分析仪器上对原始光谱进行断点拟合[12],边缘波段350~399 nm和2 450~2 500 nm 2段数据受外界噪音影响较大,将其剔除[13](图2)。保留其余波段(400~2 449 nm)数据作为土样的实际光谱反射数据[12]。利用R语言软件的Wavelet程序包中的Least Asymetric类型小波函数[14],对实际光谱反射数据进行4层分解,通过小波分解舍去小波高频系数从而进行小波去噪变换[15],再通过R语言软件中的Prospectr 程序包中的Continuum removal 功能分别对紫色土、水稻土样本光谱数据进行去包络线处理[16](图3)。图2中,土壤样本的反射和吸收特征并不明显。经过小波变换和去包络预处理后,土壤样本具有明显的反射和吸收特征:在400~2 449 nm中有4个明显的吸收谷,吸收谷波长位置分别大概位于515 nm、1 405 nm、1 915 nm和2 210 nm。
1.4建模方法及精度评价指标
1.4.1土壤pH值、全钾含量高光谱预测方法PCR方法是通过主成分分析的方法选择多个变量中影响因素较大的几个主要变量进行降维,根据得分系数矩阵将原变量代回得到新的方法[16]。PLSR方法与主成分回归有关,但不是寻找响应和独立变量之间最小方差的超平面,而是通过投影预测变量和观测变量到一个新空间来寻找一个线性回归的方法[17]。SVR方法主要是通过升维后,在高维空间中构造线性决策函数来实现线性回归,用e不敏感函数,其基础主要是e不敏感函数和核函数算法[18]。
分别从紫色土土壤样本和水稻土土壤样本中按RS(Random sample)样本集划分方法选择1/3样本数据作为验证集,2/3样本数据作为标定集。紫色土土壤的标定集和验证集的样本数分别为52和26;水稻土土壤样本标定集和验证集的样本数分别为22和11。小波分析后去包络线反射率作为输入量,分别采用PLR、PCR、SVR 3种方法对紫色土、水稻土pH值和全钾含量进行反演。其中PLSR、PCR、SVR 3种方法是用The UnscreamblerX10.5软件实现的。
2结果与分析 2.1土壤pH值、全钾含量与光谱反射率的相关性分析
对预处理后的水稻土、紫色土土壤样本光谱反射率分别与土壤pH、全钾含量进行相关性统计,结果如图4~图7所示。从图中可以看出,水稻土土壤预处理后的光谱反射率与pH值的相关系数范围为-0.621~0.524(图4),相关系数最大绝对值出现在波长1 100 nm处。预处理后的紫色土光谱反射率与pH值的相关系数范围为-0.589~0.441(图5),相关系数最大绝对值出现在波长1 146 nm处。对于紫色土和水稻土2种不同土壤类型,其光谱反射率与pH之间都在近红外1 100 nm左右的波段出现了最大相关系数绝对值。
水稻土全钾含量与预处理后的光谱反射率的相关系数范围为-0.671~0.576(图6)。541 nm波段的反射率与水稻土土壤全钾含量表现出了最强的负相关,其相关系数值为-0.671。紫色土全钾含量与预处理后光谱反射率的相关系数范围为-0.727~0.494(图7),最大相关系数绝对值出现在波长517 nm处。紫色土全钾含量与预处理后的光谱反射率的最大相关系数与水稻土不同,但二者均在绿波段表现出了极强的负相关。
2.2土壤pH值和全钾含量的反演方法及效果评价
2.2.1土壤pH值的反演方法对土壤光谱数据进行预处理后,利用SPSS软件对土壤pH值与土壤反射光谱进行相关性分析,并进行显著性检验。在通过P