第一作者简介: 官 晓(1989-),女,硕士研究生,主要从事资源环境遥感研究。Email:gt-0504@163.com。
以德兴铜矿尾矿坝附近的土壤为研究对象,在实验室内利用ASD便携式光谱仪对研究区内68组土壤样本进行了测定,并通过研究土壤反射光谱特征,选择了反射率的对数微分变换作为土壤有机质(soil organic matter,SOM)预测模型的因变量; 通过对土壤有机质含量与土壤光谱特征的相关分析,将402 nm与2 312 nm波段反射率的对数微分变换结果参与模型建立; 最终,从多元回归分析和模糊数学2个角度建立了有机质含量的预测模型。结果表明: 基于模糊数学的研究方法优于多元线性回归方法,相关系数达到89.3%,平均相对误差较小。因此,地面实测光谱可以用于预测土壤的有机质含量。该方法具有周期短、成本低等特点。
For the purpose of better predicting the soil organic matter content in the study area, the soil near the tailings dam of the Dexing copper mine was chosen as the study object. Using the ASD device in the laboratory, the authors measured 68 groups of soil samples and, by studying soil reflectance spectral characteristics, took the logarithmic differential transformation of the selected reflectance spectra as the dependent variable of the soil organic matter prediction model. The correlation analysis of soil organic matter and soil spectra showed that the first derivative of logarithm of 402 nm and 2 312 nm wavelength reflectance was the best. Finally, from the multiple regression analysis and fuzzy mathematics, two models of organic matter content prediction were established. The results demonstrate that the research method based on fuzzy mathematics is better than multiple linear regressions, with the correlation coefficient up to 89.3% and the error relatively smaller. Studies have shown that using ground measured spectra to predict soil organic matter content has such advantages as short cycle and low cost.
土壤有机质(soil organic matter, SOM)作为反映土壤性状的重要指标, 在农业生产中发挥着至关重要的作用。为了更好地了解土壤现状, 以便有效加以利用, 借助遥感技术对土壤进行监测分析的方法得到了广泛应用。其中, 有关土壤有机质含量的预测, 利用地面实测光谱数据进行分析建模具有周期短、成本低等特点。针对高光谱遥感技术在土壤有机质含量预测中的应用, 国内外学者已做了大量工作, Marion发现有机质含量是解释520~1 750 nm谱段光谱反射差异的最重要变量, 尤其与可见光波段的相关性最高[1]。Krishnan等人在美国伊利诺伊州采集了不同质地的土壤, 利用多元逐步线性回归方法分析了光谱反射率并预测土壤中有机质含量, 得到有机质含量预测的最优波长为623.6 nm和564.4 nm。周萍基于OMIS-1数据, 对山东省招远西北端东良乡的土壤有机质含量建立了多元线性模型, 并对研究区的有机质含量进行了填图[3]。Wang等人利用统计分析、模糊数学以及一种新的模型对研究区的土壤有机质含量进行了估算, 并获得了较好的估算精度[4] 。鉴于统计分析方法是预测有机质含量最常用的分析方法之一, 结合以上学者所进行的研究, 本文利用地面实测光谱数据, 从多元回归分析和模糊数学2个角度, 对研究区范围内土壤有机质含量进行预测分析。
德兴铜矿是我国最大的露天有色金属矿山, 位于江西省德兴市, 介于N29° 02'~29° 05', E117° 43'~117° 47'之间, 矿区面积约100 km2。矿区属低山丘陵地貌, 海拔高度为65~500 m。气候温和, 属亚热带季风气候区, 年均温度17℃, 年日照时间约1 900 h, 无霜期约250 d, 年降雨量约1 900 mm。区内以红壤和黄红壤为主[5]。基于第二次土壤普查资料, 德兴市的农田有机质含量一般在3%左右, 但不同地区间存在明显的差异[6]。
采样工作在江西省德兴铜矿尾矿坝附近进行。试验地分别位于1, 2, 4号尾矿库, 共采集土壤样品68个。试验场地土壤类型主要有红壤和黄红壤(客土), 下层为尾矿砂, 成土母质多为第四系红色粘土和千枚岩[7], 土壤质地属砂土。上覆植被, 有杂草和番薯粮食作物。
野外取样时先刮平表层土, 去掉植物根系、石块等残渣, 并立即将土样放入事先准备好的样品袋内, 密封好。为了从光谱数据中消除或降低土壤水分、土壤粒度等因素对有机质吸收特征的影响, 将土壤样品置于实验室内自然风干、研磨[8]、过60目尼龙筛。将每个土壤样品分成2份, 一份用于化学分析, 采用重铬酸钾氧化-外加热法测定土壤有机质含量, 另一份用于测量光谱数据。
实验采用美国ASD便携式光谱仪对土壤样品进行光谱测定。ASD光谱仪的光谱范围为350~2 500 nm, 重采样间隔为1 nm。在测试过程中, 选取8° 的视场角, 探头垂直于土壤表面, 光源照射方向与垂直方向夹角为15° [9]。每个土样测试10次, 并将测得的10条光谱曲线的反射率均值作为该土壤样品实际的反射率数据。
本文主要采用9点加权移动平均法对光谱曲线进行平滑去噪处理[10], 即将9点反射率的加权平均值作为该样点的光谱值, 从而达到平滑去噪的目的。计算式为
式中:
本文通过去包络线法, 同时参考土壤反射光谱曲线上的特征吸收带进行波段选择。图1为研究区内某样点土壤反射光谱曲线及其包络线。
土壤光谱吸收深度曲线有利于光谱曲线之间特征波段的比较, 并且可以有效地突出光谱曲线的吸收和反射特征(图2)[11]。
光谱吸收深度曲线计算式为
R’ (λ )=1-R(λ )/RC(λ ), (2)
式中: R’ , R, RC分别表示光谱吸收深度、原始光谱及光谱包络线的反射率值; λ 为波长。
通过图2可以更清晰地看出, 原土壤反射光谱曲线特征吸收带的分布大致为360~550 nm, 900~1 250 nm, 1 350~1 500 nm, 1 850~2 120 nm, 2 300~2 400 nm。本文将基于对土壤光谱特征吸收带的分析, 选择特征吸收带内的波段参与模型建立。
基于前人研究, 同时结合实测光谱数据的研究分析, 不难得出: 一般在1 400, 1 900和2 200 nm附近有强烈的吸收谷, 这几个吸收谷是水分的吸收带, 通常认为与铁的氧化物及高岭类粘土矿物中所含OH-有关[12]; 在2 100~2 380 nm所表现出的峰谷吸收结构主要由残余在土壤中的少量水分以及空气中水分吸收引起的。土壤有机质含量主要对可见光-近红外波谱曲线影响较大, 并同土壤中氧化铁共同作用, 使光谱曲线值在500~640 nm谱段与土壤有机质含量呈负相关。其中850 nm附近光谱吸收谷的深浅与铁的氧化物含量有关。参照以上研究, 考虑到不同位置、不同吸收深度波段对土壤有机质含量的影响, 本实验对位于地表层、离尾矿坝距离不同的土壤样品的光谱曲线进行分析, 其中编号1~3采样点是按照离尾矿库由远及近采集的, 且有机质含量分别为44.5 g/kg, 21.5 g/kg和2.0 g/kg。土壤反射光谱曲线如图3所示。
![]() | 图3 与尾矿区距离不同的土壤反射光谱曲线(采样点1~3表示距离尾矿库从远到近)Fig.3 Spectral reflectance curve of soil at different distances from tailings area |
结合图3可知, 由于远离尾矿坝土壤的有机质含量比尾矿库附近的含量高, 有机质含量与土壤反射率呈负相关关系, 即随着土壤中有机质含量的增加, 土壤的光谱反射率减小。有机质主要来源于腐殖质, 由于土壤中胡敏酸和富里酸的作用, 曲线在可见光— 近红外谱段范围内总体呈上升趋势。
由于德兴铜矿尾矿坝附近进行过土地复垦, 该区域内的有机质含量在土壤中的垂直分布由地面向地下呈逐渐递减的趋势。图4为不同深度的土壤光谱曲线。可以看出, 随着地面深度的不断增加, 土壤反射光谱曲线整体上移。
土壤质地不仅通过其颗粒大小影响着光谱反射率, 还通过其持水能力间接地影响着光谱反射率。本实验对20目、60目及100目粒度的土壤进行了测试, 其光谱曲线如图5所示。
![]() | 图5 不同粒度的土壤光谱曲线及包络线去除后的光谱曲线Fig.5 Spectral reflectance curve of soil and envelope line removal of different particle size |
由图5不难看出, 随着土壤粒度的不断加大, 土壤的反射率逐渐减小, 两者呈负相关关系, 而峰谷位置相对不变。
针对土壤去包络线后的光谱曲线, 相对20和100目的粒度, 60目粒度的诊断性光谱特征更为明显, 即中等尺度的粒度更适合于建立模型。
光谱微分技术(spectral derivative)是针对部分反射光谱进行数学模拟和计算不同阶次的微分值(差分), 目的是为了计算光谱梯度, 确定光谱曲线弯曲点, 以及最大值与最小值波长位置。土壤反射率经微分变化后, 不仅可以增强可见光区的光谱差异, 而且可减少光照条件和地形变化等随机因素产生的影响。光谱微分技术有助于限制低频噪声对目标光谱的影响[13]。
本实验测定了68个土壤样本的有机质含量, 其中最小值为0.09%, 最大值为4.45%, 平均值为0.70%, 标准差为0.84。对每个样本的有机质含量与处理后350~2 500 nm光谱范围的光谱数据做相关分析, 并通过决定系数R2和调整后的R2来检验模型的稳定性。而模型的预测能力通常用总均方根误差(RMSE)来检验, 即
而模型检验的精度用检验样本的相对平均误差来评价, 即
式(3)(4)中: yi为采样点的有机质含量, 即实测值;
徐彬彬[14]指出, 土壤去除有机质后反射率明显增强, 土壤光谱反射率与有机质含量呈现出很好的负相关。基于以上研究, 本实验共采集土壤样品68组, 其中55组用来建立有机质含量预测模型, 剩余13组用于模型精度检验。由于光谱反射率经数学变换后能增强光谱差异, 因而在本次研究中, 对光谱数据做了8种变换, 取出相关系数最优的3个波段列于表1。
![]() | 表1 反射率不同变换形式与有机质含量的相关分析 Tab.1 Correlation analysis of different forms of reflectance transformation and organic matter |
基于土壤光谱吸收深度曲线, 结合表1来确定样本有机质含量的敏感波段。利用选择出的波段, 借助SPSS软件建立有机质含量预测模型, 并设定显著水平sig=0.05作为选入和剔除变量的标准。土壤有机质含量模型为
Y=b0+
式中: Y为预测的有机质含量; b0为常数; k为选择的波段数; bi为系数; xi为变换后的反射率。
根据表1, 将相关系数较大的3个波段的数据参与模型的建立, 分析发现:
1)利用反射率一阶微分数据建立模型, 由于考虑到参与回归模型建立的变量之间的相关系数不能超过0.75, 否则建立的回归模型会有较大偏差这一点, 因而只能选择单个波段数据建立拟合模型。这里选择相关性较高的2 312 nm波段数据参与模型建立, 即
Y=22.889+9 153.147X2 312,
式中: Y为有机质含量的预测值; X2 312为2 312 nm处土壤的反射率一阶微分值。R2=0.588, 调整后R2=0.581, F=40.704, 该回归方程在sig=0.01的水平上显著。
2)利用反射率倒数的一阶微分建立模型, 将有机质含量相关系数较高的2 458 nm, 1 842 nm和402 nm波段数据参与模型建立。由于波段间相关性小于0.65, 因而可以都参与运算。通过波段组合选择拟合最好的模型为
Y=8.141+2 002.940X2 458+80.491X402, (7)
式中: Y为有机质含量的预测值; X2 458和X402分别为所选入2个波段的反射率倒数微分的变换值。R2=0.639, 调整后R2=0.626, F=49.589, 该回归方程在sig=0.01的水平上显著。
3)利用反射率对数的一阶微分建立模型, 将有机质含量相关系数较高的402 nm, 2 312 nm和1 394 nm数据参与模型建立, 选取波段间相关性小于0.75的波段组合。模型为
Y=17.787-1 561.217X402+7 366.957X2 312, (8)
式中: Y为有机质含量的预测值; X402和X2 312分别为选入波段反射率对数微分的变换值。R2=0.712, 调整后R2=0.706, F=55.129, 该回归方程在sig=0.01的水平上显著。而利用402 nm, 1 394 nm波段组合以及单个波段进行运算时, R2< 0.7, 故舍去。
通过上述分析不难发现, 在本实验中, 考虑到不同波段对土壤有机质含量计算的影响, 将多个波段参与模型建立, 即利用多元回归模型比一元预测模型精度要高; 利用反射率直接微分及反射率倒数的一阶微分所建立的模型精度均不太高, 而利用反射率对数的一阶微分模型的效果相对较好。
为了评价上述模型的精度, 利用建模以外的土壤样本(n=13)对该线性模型进行评价, 其平均相对误差为9.7%, 并对预测模型的有效性进行了测试[15]。图6为利用土壤反射光谱在2 312 nm和402 nm的对数微分变换形式预测的土壤有机质含量散点图。
通过利用一种模糊综合分析的预测模式, 结合所选取波段的土壤反射率变换形式进行估算, 将反射率变换后的值作为土壤有机质估算模型的输入变量。通过对土壤反射率这一变量进行相对隶属度的求算, 赋予不同波段不同的权重, 得到模糊识别矩阵, 最终建立起基于模糊数学的有机质含量预测模型。即
Y=a+bh(9)
本文选取402 nm和2 312 nm波段组合的对数一阶微分数据参与运算。
设Y为从n组数据得到的预报对象的样本集, 即
Y= ( y1, y2, …, yn) , (10)
令n为参与模型建立的样本数, m为选入参与模型建立的波段数。于是可得以下矩阵, 即
X=[Xij]m× n, (11)
式中: Xij为样本j关于指标i的特征值(即样本j关于i指标的反射率变换值), i=1, 2, …, m, j=1, 2, …, n; 本文中n=55, m=2。
为了清除m个预报因子特征值在量纲和量级上的差异, 可用式(12)(13)对其归一化, 即
rij=
或rij=
式中: ximax为第i个预报因子的最大特征值; ximin为第i个预报因子的最小特征值; rij为xij的归一化值, 0≤ rij≤ 1。预报因子与预报对象间正相关时, 预报因子归一化用式(12), 负相关时则用式(13)。由式(12)(13)将式(11)变为相对隶属度矩阵R, 即
R=[rij]m× n 。 (14)
由于m个波段对y(即有机质含量)的作用程度不同, 为了更好地对有机质含量进行预测, 需要对m个波段赋予不同的权重值。初始权向量为
W=[w1, w2, …, wm ]T , (15)
式中wi为第i个预报因子的权重,
hj=
由式(16)可得向量
h=[h1, h2, …, hn] 。 (17)
基于式(17), 建立y与h之间的回归方程, 即
其中,
最终可得基于模糊数学方法的有机质含量预测模型[16, 17, 18]为
y与h之间的相关系数为
式中:
本试验以江西德兴铜矿尾矿区附近的土壤为研究对象, 通过对土壤样本的光谱曲线进行处理分析, 从线性回归以及模糊数学2种角度分别建立了有机质含量预测模型, 得到以下结论:
1)深度不同及与尾矿坝距离不同的土壤有机质含量的递变规律在土壤光谱曲线上得到了体现, 并且在550~730 nm波段范围内, 实测的土壤反射率与有机质含量呈显著的负相关, 这与前人的研究结果一致; 针对本研究区土壤样品, 证实了360~550 nm区间内存在识别有机质的敏感波段。
2)土壤有机质含量与其光谱反射率对数微分之间存在着简单的线性关系, 运用多种反射率变换形式的数据进行回归分析, 发现利用2 312 nm和402 nm反射率对数的一阶微分建立的多元线性回归模型效果较好。
3)对比模糊数学和多元回归分析2种方法估算的土壤中有机质含量结果看, 基于模糊数学的研究方法优于多元线性回归方法, 其相关系数达到89.3%, 且平均相对误差更小。
4)不同的地理环境生成不同类型的土壤, 不同的土壤类型、成因以及外界因素影响着土壤的反射光谱曲线。鉴于本实验只是基于德兴铜矿区的土壤有机质含量进行的预测, 所建立的模型是否对其他类型土壤适用还有待进一步验证。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|