自然资源遥感, 2024, 36(3): 225-232 doi: 10.6046/zrzyyg.2023068

技术应用

高光谱反演耕地土壤质量评价元素含量方法研究

易孜芳,1,2, 周磊磊1,2, 骆检兰1, 曹里,2

1.湖南省地球物理地球化学调查所,长沙 410116

2.自然资源部南方丘陵区自然资源监测监管重点实验室,长沙 410119

A method for hyperspectral inversion of element contents for soil-quality evaluation of cultivated land

YI Zifang,1,2, ZHOU Leilei1,2, LUO Jianlan1, CAO Li,2

1. Hunan Geophysical and Geochemical Institute, Changsha 410116, China

2. Key Laboratory of Natural Resources Monitoring and Supervision in Southern Hilly Region, Ministry of Natural Resources, Changsha 410119, China

通讯作者: 曹 里(1986-),男,高级工程师,主要从事国产遥感卫星在轨应用评价及自然资源行业应用技术研究。Email:cnclcn@foxmail.com

责任编辑: 李瑜

收稿日期: 2023-03-15   修回日期: 2023-08-30  

基金资助: 湖南省自然资源厅科技计划项目“自然资源省级高光谱应用支撑库建设关键技术与应用研究”(20230119CH)
湖南省自然科学基金资助项目“天-空-地协同观察下的洞庭湖土壤高光谱遥感多尺度监测与反演研究”(2024JJ8353)
自然资源部省合作项目“自然资源遥感智能解译样本及光谱数据库建设关键技术研究及应用示范”(2023ZRBSHZ021)

Received: 2023-03-15   Revised: 2023-08-30  

作者简介 About authors

易孜芳(1995-),女,工程师,主要从事资源遥感和测绘地理信息研究。Email: 690267040@qq.com

摘要

为探讨利用高光谱快速估算耕地土壤质量元素镉(Cd)、砷(As)含量的可行性和准确度,该文针对元素光谱特征波段提取及高光谱定量反演建模开展研究。使用一阶/二阶微分(first derivative/second derivative,FD/SD)、倒数对数(logarithm reciprocal,LR)、包络线去除(continuum removal,CR)4种光谱变换与竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)、相关性分析(Pearson correlation analysis,PCC)2种特征筛选相组合的多种方法提取光谱特征波段。在此基础上,分别利用偏最小二乘回归(partial least squares regression,PLSR)和粒子群改进的随机森林回归(particle swarm optimization-random forest regression,PSO-RFR)2种回归模型来反演元素含量并进行精度验证。结果表明,实验区土壤元素Cd和As预测的最佳模型均为FD-CARS-PLSR,Cd和As元素模型的决定系数R2最高分别为0.863和0.959,相对分析误差分别为2.799和5.119。FD/SD光谱变换结合CARS特征筛选能够提升PLSR反演模型的精度。研究成果可以为土壤Cd和As元素含量的快速估算提供参考。

关键词: 高光谱遥感; 光谱变换; 特征波段选择; 偏最小二乘回归; 竞争性自适应重加权算法

Abstract

To explore the feasibility and accuracy of the method of utilizing hyperspectral data to estimate the contents of elements Cd and As for soil quality elevation of cultivated land, this study delves into the extraction of characteristic bands of the spectra of both elements and the modeling of quantitative hyperspectral inversion. The characteristic bands of spectra were extracted using multiple methods derived from the combination of four spectral transformations and two feature selection methods, with the former comprising first-order /second-order differential (FD/SD), reciprocal logarithm (LR), and continuum removal (CR) and the latter consisting of the competitive adaptive reweighted sampling (CARS) method and the Pearson correlation coefficient (PCC) analysis. Based on this, the element content inversion was conducted using the partial least squares regression (PLSR) and the particle swarm optimization optimized random forest regression (PSO-RFR), followed by the verification of inversion accuracy. The results indicate that the FD-CARS-PLSR inversion model exhibited the best prediction effect for both elements, with maximum determination coefficients R2 of 0.863 and 0.959 and relative percent differences (RPDs) of 2.799 and 5.119 for Cd and As, respectively. The FD and SD spectral transformations combined with the CARS method can improve the accuracy of the PLSR inversion model. The results of this study can provide a reference for the rapid estimation of the contents of Cd and As in soil.

Keywords: hyperspectral remote sensing; spectral transformation; characteristic band selection; partial least squares regression; competitive adaptive reweighted sampling

PDF (8083KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

易孜芳, 周磊磊, 骆检兰, 曹里. 高光谱反演耕地土壤质量评价元素含量方法研究[J]. 自然资源遥感, 2024, 36(3): 225-232 doi:10.6046/zrzyyg.2023068

YI Zifang, ZHOU Leilei, LUO Jianlan, CAO Li. A method for hyperspectral inversion of element contents for soil-quality evaluation of cultivated land[J]. Remote Sensing for Land & Resources, 2024, 36(3): 225-232 doi:10.6046/zrzyyg.2023068

0 引言

土壤是生态环境的重要组成部分,也是难以再生、不可或缺的自然资源。伴随着工业化进程加快、城镇范围不断扩张,人类活动对土壤环境质量的影响日益显著。耕地土壤中一些元素如镉(Cd)、砷(As)等虽然含量微少,却容易在耕地土壤中富集,且难以降解,并可能通过生态系统循环进入人体,危害粮食安全和人体健康[1]。传统的测定这些土壤质量评价元素的方法以实验室化学分析方法为主,虽然检测精度高,但普遍要求破坏土壤样品,使用有潜在危害性的化学试剂进行前处理,且步骤繁琐、花费时间长[2]。如何对这些影响土壤质量的元素进行快速测定已成为研究热点[3]。土壤的光谱特征是土壤理化参数的综合反映,利用高光谱手段,高效便捷、低成本地获取土壤光谱,从中提取与元素相关的光谱特征,建立元素含量反演模型,改进土壤质量元素含量测定方法,实现对元素含量快速估测,将会是未来发展方向[4]

目前利用高光谱遥感进行元素含量反演的难点之一是与元素相关的信息在土壤光谱中表现较弱,所以研究多通过光谱预处理手段先减弱环境噪声影响,然后进行光谱变换突出相关特征[5]。如杨晓宇等[6]通过对比多种光谱预处理方法,发现多元散射校正去噪效果最优,可以有效降低光谱噪声; 雷宇斌等[7]发现倒数一阶微分组合变换能显著提升Cd和光谱的相关性。再者,由于高光谱波段众多,为提高反演模型运行效率、增强光谱与元素含量之间的相关性,需要对特征波段进行筛选。目前,最常用的特征筛选方法为相关系数法,此外有方差分析法、遗传算法、连续投影法、竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)等。方差分析法常被应用于定性而非定量分析[8]; 遗传算法可以较好地保留变量间的组合优势,但运行效率较低,往往需要预设较多参数,且容易受到适应度函数的影响; 连续投影算法可能纳入无效信息和干扰波段,因而常在精选阶段使用[9]; CARS方法将模型性能看作适应度函数,将特征筛选看作是优化过程,运行效率高。袁自然等[10]利用CARS进行光谱粗选后,参与建模的波段数大幅减少,结果表明,基于CARS优化后的支持向量机(support vector machine,SVM)模型预测精度明显提高。最后,高光谱数据维数高,而研究的样本量普遍较小,针对该特点选择合适的反演模型也尤为重要。高光谱反演模型又可分为线性和非线性2大类。陈元鹏等[11]通过对多种高光谱反演土壤重金属含量经验模型优选研究发现偏最小二乘回归(partial least squares regression,PLSR)对研究区内土壤重金属含量的反演最为有效; 金昭等[12]利用9种机器学习模型对Cd等5种土壤重金属含量反演,表明随机森林模型对5种重金属的预测效果均较为理想,是研究区土壤重金属空间预测的最优模型。

在前述研究基础上,本研究对比多种光谱变换和光谱筛选组合方式,分别使用了线性和非线性2种建模方法进行元素含量反演,在众多组合方式中优选土壤质量元素Cd和As反演的最佳方法。实验主要分以下几个步骤: ①光谱预处理,对原始反射光谱(YS)数据进行5 nm重采样、SG(Savitzky-Golay)平滑处理、多元散射校正(multiplicative scatter correction,MSC)预处理,消除环境噪声影响,利用一阶微分(first derivative,FD)、二阶微分(second derivative,SD)、倒数对数(logarithm reciprocal,LR)、包络线去除(continuum removal,CR)进行光谱变换突出光谱特征; ②特征波段筛选,采用相关性分析(Pearson correlation analysis,PCC)和CARS方法筛选与元素含量相关的高光谱特征波段; ③反演建模,将样本分为建模集和验证集,以所筛选的特征波段为模型变量,根据建模集建立PLSR和粒子群改进的随机森林回归(particle swarm optimization-random forest regression,PSO-RFR)模型反演元素含量,用验证集进行模型精度验证。

1 研究区概况与数据源

1.1 研究区概况

研究区位于浏阳市永安镇丰裕村(图1),面积共计1.85 km2。该区域为平原向丘陵的过渡地带,南侧为捞刀河,河畔为冲积平原,地势高低起伏不大。当地属亚热带季风湿润气候,光照、水源充足,耕地土壤类型主要为水稻土和红壤,种植作物以水稻、油菜为主。

图1

图1   研究区位置和采样点分布

Fig.1   Location of research area and sample distribution


1.2 样品采集与光谱测样

本次实验采用“五点法”采集研究区耕地表层0~20 cm深度的土壤共50份。样品采集后送至实验室进行风干、去除杂质、研磨、过筛制样。所制样品分为2部分,一部分样品通过化学方法测定Cd和As元素含量; 另一部分送至实验室进行土壤高光谱测样。所用的高光谱测试仪器为ASD Field Spec4地物光谱仪。

1.3 光谱预处理

对YS数据进行5 nm重采样、SG平滑处理、MSC预处理,消除环境噪声影响。利用FD/SD,LR,CR数据进行光谱变换突出光谱特征。YS数据经SG平滑和MSC预处理后的变换效果示意如图2所示。

图2

图2   土壤样品光谱反射率曲线

Fig.2   Spectral reflectance curve of soil samples


2 模型方法与理论

2.1 特征波段筛选

2.1.1 相关系数法

PCC可以反映2个变量间线性关系的强弱,是在高光谱反演土壤相关组分含量研究中最广为运用的特征波段筛选方法[13]。此方法先计算各个波长值X和土壤组分含量Y的相关系数rX,Y。计算公式如下:

rX,Y=cov(X,Y)σXσY

式中: cov为协方差; σ为标准差。

然后通过相关系数显著性水平p来筛选特征波段,当p<0.05时,为显著相关; p<0.01时,为极显著相关。

2.1.2 CARS算法

CARS模仿达尔文进化论的“适者生存”的原则,通过逐步删除不重要变量来确定最优变量子集[14]。通过N次蒙特卡洛采样随机选取样本,计算每个波长变量回归系数绝对值权重,进行特征波长筛选。波长的筛选过程分为2步: 第一步,采用指数衰减函数去除绝对回归系数相对较小的波长,第i次采样保留的波长比例Ri,计算公式为:

Ri=μe-k
μ=(n/2)1N-1
k=ln(n/2)N-1

式中: μk为常数,与采样次数N和原始波长变量数量n有关。

第二步,对筛选后的波长变量采用自适应重加权采样,选择Ri×n个波长变量进行PLSR建模,并计算模型的交叉验证均方根误差(root mean square error for cross-validation,RMSECV),直到达到设定的循环次数或者阈值要求[15]

2.2 反演建模

2.2.1 PLSR模型

PLSR模型被广泛用于土壤组分高光谱反演研究中。这一方法解决了多重共线性问题,适用于样本量较小的数据集反演建模,有利于提炼关键的光谱信息。PLSR综合了主成分分析、典型相关分析和多元线性回归的优势。它提供了一种多对多线性回归建模方法,并在此过程中考虑自变量对因变量的解释能力。

2.2.2 PSO-RFR模型

随机森林回归(random forest regression,RFR)本质上是一种适用于小规模数据的机器学习算法,它将基于多棵随机生成的决策树预测的平均值作为结果返回。其采用由上至下的递归方式,从决策树的根节点开始,在其内部节点上对属性值进行测试比较,确定对应的分支,在决策树的叶子节点处得到结果。RFR算法具有对参数不敏感、不容易过拟合和训练速度快等优点,在使用条件上与本实验的条件和需求相符。

实验证明,RFR参数中的决策树数量、决策树最大深度对性能影响较大[16]。因此本文引入粒子群优化算法(particle swarm optimization,PSO)对RFR的上述2个参数进行自动寻找最优解,可以减少手动设置造成的模型精度降低和不稳定。

PSO是一种基于迭代寻优的群计算技术,以所有迭代中粒子群搜索到的使得适应值最小的位置为最优位置。本实验以RFR中决策树的数量和决策树最大深度2个参数作为粒子维数,选取RFR模型的均方根误差(root mean square error,RMSE)作为粒子群算法的适应度函数[17],多次迭代确定RFR模型达到RMSE最小值时所对应的参数值。

3 实验结果与分析

3.1 特征波段筛选结果

3.1.1 PCC特征筛选

PCC相关性分析的结果如图3所示,图中蓝色和红色直线分别表示通过极显著水平(p<0.01)和显著性水平(p<0.05)检验的相关临界值。Cd,As原始光谱的相关系数区间范围分别为-0.385~-0.109,-0.521~0.412,p<0.01的波段分别为241和81个。由图3(a)可知,对于原始光谱而言,Cd的相关波段虽然数量多,但相关程度弱,相关系数的绝对值大多在0.3左右。经光谱变换后,元素的相关性有了不同程度的提升,FD,LR,CR,SD光谱变换结果分别如图3(b)(e)所示。As以p<0.01的波段为元素特征波段。对于Cd,由于其p<0.01的波段较少,因而以p<0.05为其检验标准。特征波段筛选结果如表1所示。对于Cd元素,经CR变换后最大相关系数变化最明显,相关系数绝对值最高达0.634,呈负相关; 对于As元素,经各种光谱变换后最大相关系数较原始光谱都有提升,最大相关系数绝对值普遍达到0.7以上,特征波段数明显增多,其中提升效果最好为FD方式。

图3

图3   原始与4种变换光谱与元素含量相关系数

Fig.3   Correlation coefficient of original spectrum and its transformed spectrum with element content


表1   皮尔森相关系数特征波段筛选

Tab.1  Pearson correlation coefficient feature band election

元素预处理方法特征波段数最大相关系数
CdYS241(0.385)*
FD73(0.441)*
SD610.499*
LR120.336*
CR68(0.634) *
AsYS81(0.521)**
FD214(0.839)**
SD1080.754**
LR2920.758**
CR191(0.756)**

①最大相关系数一列中()表示负相关,*表示通过显著性水平检验(p<0.05),**表示通过极显著性水平检验(p<0.01)。

新窗口打开| 下载CSV


3.1.2 CARS特征筛选

由于本实验的样本量较少,CARS方法特征筛选利用四折交叉验证,蒙特卡洛采样次数设定为100次,以RMSECV最小为评价标准。以FD预处理后的光谱为例,Cd,As元素的CARS变量优选过程分别如图4(a)(b)所示。每幅图从上至下分别表示波段数量、RMSECV、回归系数随采样次数增加的变化趋势。可以看出,在指数衰减函数的作用下,波段变量的数量先快速下降后缓慢减少。Cd,As元素分别在CARS采样次数为46,48次时,RMSECV最小,表明此时模型精度最佳。Cd,As元素分别选择了35和32个特征波段,分别占总波段数目的9.2%和8.4%。对选择的特征波段个数和占总波段数的百分比统计见表2。与PCC相关系数法比较发现,CARS方法能够明显减少As元素的特征波段个数。

图4

图4   CARS算法变量筛选过程

Fig.4   Variable selection process by CARS method


表2   CARS特征波段筛选

Tab.2  CARS feature bands selection

元素光谱类型特征波段数占总波段数比例/%
CdYS6015.8
FD359.2
SD307.9
LR5113.4
CR4612.1
AsYS359.2
FD328.4
SD4110.8
LR359.2
CR328.4

新窗口打开| 下载CSV


3.2 反演建模结果

本次实验选取基于YS数据及FD,SD,LR,CR这4种光谱变换与PCC和CARS这2种特征筛选方式组合选取的特征波段为自变量,分别建立PCC-PLSR和CARS-PLSR模型。采用K-S(Kennard-Stone)划分方法训练集和测试集[18],设定的划分比例为7∶3。本研究共测得50个样本点,其中作为训练集的样本点共35个,其余作为测试集共15个。在划分时使训练集和测试集中均包含一些高值和低值,在空间上在试验区的各个方位间隔分布。

采用模型决定系数(R2),RMSE和相对分析误差(relative percent deviation, RPD)作为模型精度指标。其模型精度评价见表3。RMSE表示模型稳定性,其值越低模型稳定性越好[19]

表3   模型精度评价

Tab.3  Model accuracy evaluation

R2RPD模型精度评价
R2≤0.5RPD≤1.5不具有预测能力
0.5<R2≤0.681.5<RPD≤2.0可区分高值和低值
0.68<R2≤0.822.0<RPD≤2.5能够近似预测
0.82<R2≤0.92.5<RPD≤3.0预测能力良好
R2>0.9RPD>3.0预测能力极佳

新窗口打开| 下载CSV


3.2.1 PLSR模型构建

PLSR反演模型的实验结果如表4所示,各元素不同光谱的最佳反演结果已在表中黑色加粗字体表示。对于PCC-PLSR模型,2种元素均为FD和SD光谱建模集R2较高。Cd元素验证集光谱R2均小于0.5,预测效果较差。As元素光谱验证集R2均大于0.5,其中FD光谱最高SD光谱次之,R2分别为0.794和0.741。原始光谱经过光谱变换后,验证集R2有一定程度的提升。

表4   PLSR模型估测结果

Tab.4  PLSR model estimation results

元素光谱类型PCC-PLSRCARS-PLSR
建模集验证集建模集验证集
R2RMSER2RMSERPDR2RMSER2RMSERPD
CdYS0.3651.796-0.4411.6920.8620.4391.087-0.2562.8450.924
FD0.7041.198-0.1551.6470.9630.9540.4770.8630.5722.799
SD0.8110.6990.2362.4071.1840.9650.4230.5570.8781.555
LR0.3521.334-0.0242.6191.0230.3571.2870.1502.5641.122
CR0.6310.8530.0462.8351.0600.5731.447-0.3061.7630.906
AsYS0.8321.2770.6151.9321.6690.7791.5280.6481.4101.746
FD0.9280.8690.7941.2932.2830.9810.4310.9590.6395.119
SD0.9060.9550.7411.5372.0330.9850.3970.8701.1592.870
LR0.8431.3450.6721.2561.8080.8441.2670.7111.4171.926
CR0.8281.3730.7331.3632.0050.8801.1200.7481.3692.061

新窗口打开| 下载CSV


CARS-PLSR和PCC-PLSR模型的建模集R2相差不大,主要从验证集R2比较二者。从表中可以看出,CARS特征筛选相比于PCC对各元素光谱验证集R2有较为明显的提升作用。其中,FD和SD光谱的提升效果最明显。Cd,As元素FD光谱验证集R2分别从-0.155和0.794提升至0.863和0.959; SD光谱验证集R2分别从0.236和0.741提升至0.557和0.870。

比较每种元素的验证集RPD大小,可以看到,Cd元素的FD-CARS-PLSR的RPD最高,为2.799,表明模型具有良好的预测能力。As元素的FD-CARS-PLSR的RPD最高,为5.119,表明模型预测能力极佳; 其次为SD-CARS-PLSR,RPD为2.870,表明模型有良好的预测能力。

3.2.2 PSO-RFR模型构建

由于本实验样本量较少,设置PSO优化模型的粒子数N=5,最大迭代次数为100次,决策树数量变化范围为[1~100],决策树深度变化范围为[1~f](f为输入变量维度)。分别构建PCC-PSO-RFR模型和CARS-PSO-RFR模型,元素含量反演结果如表5所示。从表中分析可知,对于PCC-PSO-RFR模型2种元素各光谱的建模集R2均在0.8以上,且彼此相差不大,重点比较预测集反演结果。Cd元素的预测集R2均小于0.5,预测效果较差。As元素FD和LR光谱验证集R2高于原始光谱,分别为0.833和0.666; SD和CR光谱变换验证集R2反而不如原始光谱。总的来说,CARS-PSO-RFR和PCC-PSO-RFR模型的建模集R2差别不大。表明CARS方法不能提升PSO-RFR模型的预测精度。

表5   PSO-RFR模型估测结果

Tab.5  PSO-RFR model estimation results

元素光谱类型PCC-PSO-RFRCARS-PSO-RFR
建模集验证集建模集验证集
R2RMSER2RMSERPDR2RMSER2RMSERPD
CdYS0.8120.977-1.3512.1620.6540.7270.759-0.2192.8040.994
FD0.8820.757-0.0421.5640.9850.8310.9120.0661.4941.039
SD0.8190.6840.3232.2651.2160.8580.8570.0831.2641.044
LR0.8210.701-0.1002.7141.0080.8380.6460.0942.6471.051
CR0.9150.4080.2302.5481.1780.8360.897-0.5111.8960.962
AsYS0.8821.0710.5862.0031.5680.8631.205-0.2052.6101.202
FD0.9090.9800.8331.1642.5420.9470.7220.7321.6351.968
SD0.9440.7380.5542.0171.5680.9360.8150.3832.5231.277
LR0.9270.9210.6661.2671.8190.9240.8870.5591.7511.518
CR0.9480.7560.1652.4121.0950.9080.9830.6781.5471.762

新窗口打开| 下载CSV


3.2.3 最佳模型选择

比较PLSR和PSO-RFR这2种建模方法,分别选择其中预测效果最好的模型绘制Cd,As元素的实测值与预测值的1∶1散点图,如图5所示。通过对比发现,PLSR模型相比PSO-RFR模型,验证集样本分布距1∶1直线偏离较小,样本基本沿1∶1直线呈现线性分布,说明PLSR模型的预测精度整体优于PSO-RFR模型,这可能是由于PLSR更适用于样本量较少而变量维数较高的实验数据。在本实验中该地区土壤质量元素Cd,As元素预测的最佳模型均为FD-CARS-PLSR,模型对As元素的预测精度与袁自然等[10]利用CARS优化PSO-SVM模型的结果相当,R2均在0.95以上,表明实验结果较为可信。

图5

图5   最优PLSR和PSO-RFR验证集反演1∶1图

Fig.5   The optimal PLSR and PSO-RFR Validation set inversion 1∶1 diagram


4 结论与讨论

1)通过实验室测量高光谱,经光谱变换和特征波段筛选后,建立反演模型能够实现对土壤Cd,As元素含量的快速估算。As元素最佳反演模型为FD-CARS-PLSR,R2为0.959,RPD为5.119,表明模型预测能力极佳; Cd元素最佳反演模型为FD-CARS-PLSR,R2为0.863,RPD为2.799,表明模型能够近似预测。模型能够满足对土壤元素快速估测的实际需求,应进一步考虑实验室高光谱数据与无人机、航空航天高光谱遥感影像的关联性,为今后利用高光谱遥感影像数据大规模反演土壤元素含量提供依据。

2)FD,SD光谱变换与CARS特征筛选组合方式能够提取特征波段,提升PLSR方法的高光谱反演精度。通过多种光谱变换方式对比,基于CARS特征筛选方法的PLSR模型的预测精度比基于PCC方法的高。这可能是由于PCC没有考虑光谱存在多重共线性这一特点,相邻光谱波段相关性强,筛选出的波段存在冗余。此外,FD,SD光谱变换与CARS特征筛选组合方式提取的特征波段对PSO-RFR模型的提升效果不显著。这可能是由于RFR作为一种非线性机器学习模型,在模型训练过程考虑了大量非线性关系,而CARS方法挑选的特征变量可能并不能观察到这些特征[20],因而造成其模型精度提升不明显。

参考文献

张东辉, 赵英俊, 陆冬华, .

高光谱在土壤重金属信息提取中的应用与实现

[J]. 土壤通报, 2018, 49(1):31-37.

[本文引用: 1]

Zhang D H, Zhao Y J, Lu D H, et al.

Application and realization of hyperspectral information extraction of heavy metals in soil

[J]. Chinese Journal of Soil Science, 2018, 49(1):31-37.

[本文引用: 1]

余涛, 蒋天宇, 刘旭, .

土壤重金属污染现状及检测分析技术研究进展

[J]. 中国地质, 2021, 48(2):460-476.

[本文引用: 1]

Yu T, Jiang T Y, Liu X, et al.

Research progress in current status of soil heavy metal pollution and analysis technology

[J]. Geology in China, 2021, 48(2):460-476.

[本文引用: 1]

贺军亮, 张淑媛, 查勇, .

高光谱遥感反演土壤重金属含量研究进展

[J]. 遥感技术与应用, 2015, 30(3):407-412.

DOI:10.11873/j.issn.1004\|0323.2015.3.0407      [本文引用: 1]

土壤重金属污染是当今重要的世界性环境问题之一。如何快速高效地获取土壤重金属含量及分布信息是进行污染风险评价及预测研究的前提。高光谱遥感具有无损、实时获取信息的优势,利用高光谱技术反演土壤重金属含量仍处于探讨阶段,对其反演机理和建模方法的研究成果进行了介绍和分析。认为充分研究不同类型土壤对重金属的吸附特性,是深入理解重金属含量反演机理的基础。加强不同土壤类型、不同污染程度的案例对比分析,发展光谱信号处理方法,引入非线性建模算法,构建重金属形态量反演模型,是土壤重金属含量遥感估算研究的重要研究方向。

He J L, Zhang S Y, Zha Y, et al.

Review of retrieving soil heavy metal content by hyperspectral remote sensing

[J]. Remote Sensing Technology and Application, 2015, 30(3):407-412.

[本文引用: 1]

张静静, 周卫红, 邹萌萌, .

高光谱遥感监测大面积土壤重金属污染的研究现状、原理及展望

[J]. 江苏农业科学, 2018, 46(12):9-13.

[本文引用: 1]

Zhang J J, Zhou W H, Zou M M, et al.

Research status,principle and prospect of hyperspectral remote sensing monitoring of heavy metal pollution in large areas

[J]. Jiangsu Agricultural Sciences, 2018, 46(12):9-13.

[本文引用: 1]

刘彦平, 罗晴, 程和发.

高光谱遥感技术在土壤重金属含量测定领域的应用与发展

[J]. 农业环境科学学报, 2020, 39(12):2699-2709.

[本文引用: 1]

Liu Y P, Luo Q, Cheng H F.

Application and development of hyperspectral remote sensing technology to determine the heavy metal content in soil

[J]. Journal of Agro-Environment Science, 2020, 39(12):2699-2709.

[本文引用: 1]

杨晓宇, 包妮沙, 曹粤, .

基于无人机成像光谱技术的农田土壤养分估测及制图

[J]. 地理与地理信息科学, 2021, 37(5):38-45.

[本文引用: 1]

Yang X Y, Bao N S, Cao Y, et al.

Estimation and mapping of soil nutrient in farmland based on UAV imaging spectrometry

[J]. Geography and Geo-Information Science, 2021, 37(5):38-45.

[本文引用: 1]

雷宇斌, 刘宁, 郭云开, .

高光谱组合变换下土壤含量模型反演研究

[J]. 测绘工程, 2018, 27(11):71-76.

[本文引用: 1]

Lei Y B, Liu N, Guo Y K, et al.

Inversion of soil Cd content with GWR model under hyper-spectral combined transformation

[J]. Engineering of Surveying and Mapping, 2018, 27(11):71-76.

[本文引用: 1]

褚小立, 袁洪福, 陆婉珍.

近红外分析中光谱预处理及波长选择方法进展与应用

[J]. 化学进展, 2004, 16(4):528-542.

[本文引用: 1]

Chu X L, Yuan H F, Lu W Z.

Progress and application of spectral data pretreatment and wavelength selection methods in NIR analytical technique

[J]. Progress in Chemistry, 2004, 16(4):528-542.

[本文引用: 1]

宋相中, 唐果, 张录达, .

近红外光谱分析中的变量选择算法研究进展

[J]. 光谱学与光谱分析, 2017, 37(4):1048-1052.

[本文引用: 1]

Song X Z, Tang G, Zhang L D, et al.

Research advance of variable selection algorithms in near infrared spectroscopy analysis

[J]. Spectroscopy and Spectral Analysis, 2017, 37(4):1048-1052.

[本文引用: 1]

袁自然, 魏立飞, 张杨熙, .

优化CARS结合PSO-SVM算法农田土壤重金属砷含量高光谱反演分析

[J]. 光谱学与光谱分析, 2020, 40(2):567-573.

[本文引用: 2]

Yuan Z R, Wei L F, Zhang Y X, et al.

Hyperspectral inversion and analysis of heavy metal arsenic content in farmland soil based on optimizing CARS combined with PSO-SVM algorithm

[J]. Spectroscopy and Spectral Analysis, 2020, 40(2):567-573.

[本文引用: 2]

陈元鹏, 张世文, 罗明, .

基于高光谱反演的复垦区土壤重金属含量经验模型优选

[J]. 农业机械学报, 2019, 50(1):170-179.

[本文引用: 1]

Chen Y P, Zhang S W, Luo M, et al.

Empirical model optimization of hyperspectral inversion of heavy metal content in reclamation area

[J]. Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(1):170-179.

[本文引用: 1]

金昭, 吕建树.

基于机器学习模型的区域土壤重金属空间预测精度比较研究

[J]. 地理研究, 2022, 41(6):1731-1747.

DOI:10.11821/dlyj020210528      [本文引用: 1]

为识别区域土壤重金属的空间变异特征并厘清其影响因素,本研究构建了多元线性回归(MLR)、弹性网络回归(ENR)、随机森林(RF)、随机梯度提升(SGB)、堆叠(stacking)集成模型、反向传播神经网络(BP-ANN)、基于模型平均的神经网络集成(avNNet)、线性核支持向量机(SVM-L)和高斯核支持向量机(SVM-R)共九种机器学习模型,利用山东省中部土壤重金属(Cd、Cu、Hg、Pb和Zn)和环境辅助变量数据,开展区域土壤重金属空间预测精度比较研究。结果表明:RF对五种重金属空间预测的决定系数(R<sup>2</sup>)介于0.263~0.448之间,平均绝对误差(MAE)和均方根误差(RMSE)分别小于8.408和10.636,预测值/实际值(P/O)均接近于1,对五种重金属的预测效果均较为理想,是研究区土壤重金属空间预测的最优模型;SVM-R整体预测性能仅次于RF,各项精度评价指标均相对稳健,可作为备选模型;其余七种模型的预测性能均明显低于RF和SVM-R。RF的空间预测结果显示,研究区五种重金属呈现出相似的空间分布格局,含量均由研究区东北部向西南部递减,包括东北部、北部和南部3个高值区,且高值区与当地工业–交通密集区的分布格局一致,反映出人类活动是研究区土壤重金属空间分异的主要影响因素。本研究可为区域土壤污染调查、评价和管控提供科学参考。

Jin Z, Lyu J S.

Comparison of the accuracy of spatial prediction for heavy metals in regional soils based on machine learning models

[J]. Geographical Research, 2022, 41(6):1731-1747.

[本文引用: 1]

涂宇龙, 邹滨, 姜晓璐, .

矿区土壤Cu含量高光谱反演建模

[J]. 光谱学与光谱分析, 2018, 38(2):575-581.

[本文引用: 1]

Tu Y L, Zou B, Jiang X L, et al.

Hyperspectral remote sensing based modeling of Cu content in mining soil

[J]. Spectroscopy and Spectral Analysis, 2018, 38(2):575-581.

[本文引用: 1]

Li H D, Liang Y Z, Xu Q S, et al.

Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration

[J]. Analytica Chimica Acta, 2009, 648(1):77-84.

DOI:10.1016/j.aca.2009.06.046      PMID:19616692      [本文引用: 1]

By employing the simple but effective principle 'survival of the fittest' on which Darwin's Evolution Theory is based, a novel strategy for selecting an optimal combination of key wavelengths of multi-component spectral data, named competitive adaptive reweighted sampling (CARS), is developed. Key wavelengths are defined as the wavelengths with large absolute coefficients in a multivariate linear regression model, such as partial least squares (PLS). In the present work, the absolute values of regression coefficients of PLS model are used as an index for evaluating the importance of each wavelength. Then, based on the importance level of each wavelength, CARS sequentially selects N subsets of wavelengths from N Monte Carlo (MC) sampling runs in an iterative and competitive manner. In each sampling run, a fixed ratio (e.g. 80%) of samples is first randomly selected to establish a calibration model. Next, based on the regression coefficients, a two-step procedure including exponentially decreasing function (EDF) based enforced wavelength selection and adaptive reweighted sampling (ARS) based competitive wavelength selection is adopted to select the key wavelengths. Finally, cross validation (CV) is applied to choose the subset with the lowest root mean square error of CV (RMSECV). The performance of the proposed procedure is evaluated using one simulated dataset together with one near infrared dataset of two properties. The results reveal an outstanding characteristic of CARS that it can usually locate an optimal combination of some key wavelengths which are interpretable to the chemical property of interest. Additionally, our study shows that better prediction is obtained by CARS when compared to full spectrum PLS modeling, Monte Carlo uninformative variable elimination (MC-UVE) and moving window partial least squares regression (MWPLSR).

Tan K, Wang H M, Zhang Q Q, et al.

An improved estimation model for soil heavy metal(loid) concentration retrieval in mining areas using reflectance spectroscopy

[J]. Journal of Soils and Sediments, 2018, 18(5):2008-2022.

[本文引用: 1]

孙波, 张弛, 尹世超, .

基于PSO-RF的GNSS-IR土壤湿度反演方法研究

[J]. 无线电工程, 2021, 51(10):1080-1085.

[本文引用: 1]

Sun B, Zhang C, Yin S C, et al.

Research on GNSS-IR soil moisture inversion method based on PSO-RF

[J]. Radio Engineering, 2021, 51(10):1080-1085.

[本文引用: 1]

范升旭, 杨春曦, 杨启良, .

基于粒子群-随机森林算法和气象数据的三七叶面积生长预测模型

[J]. 中草药, 2022, 53(10):3103-3110.

[本文引用: 1]

Fan X X, Yang C X, Yang Q L, et al.

Prediction model of Panax notoginseng leaf area growth based on particle swarm-optimization random forest algorithm and meteorological data

[J]. Chinese Traditional and Herbal Drugs, 2022, 53(10):3103-3110.

[本文引用: 1]

魏丹萍, 郑光辉.

高光谱反射率的滨海地区土壤全磷含量反演

[J]. 光谱学与光谱分析, 2022, 42(2):517-523.

[本文引用: 1]

Wei D P, Zheng G H.

Estimation of soil total phosphorus content in coastal areas based on hyperspectral reflectance

[J]. Spectroscopy and Spectral Analysis, 2022, 42(2):517-523.

[本文引用: 1]

Malley D F, Williams P C.

Use of near-infrared reflectance spectroscopy in prediction of heavy metals in freshwater sediment by their association with organic matter

[J]. Environmental Science & Technology, 1997, 31(12):3461-3467.

[本文引用: 1]

李冠稳, 高小红, 肖能文, .

基于sCARS-RF算法的高光谱估算土壤有机质含量

[J]. 发光学报, 2019, 40(8):1030-1039.

[本文引用: 1]

Li G W, Gao X H, Xiao N W, et al.

Estimation soil organic matter contents with hyperspectra based on sCARS and RF algorithms

[J]. Chinese Journal of Luminescence, 2019, 40(8):1030-1039.

[本文引用: 1]

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发