自然资源遥感, 2023, 35(1): 189-197 doi: 10.6046/zrzyyg.2022047

技术应用

基于Landsat8 OLI影像干旱区绿洲土壤含盐量反演

黄晓宇,1, 王雪梅,1,2, 卡吾恰提·白山1

1.新疆师范大学地理科学与旅游学院,乌鲁木齐 830054

2.新疆维吾尔自治区重点实验室“新疆干旱区湖泊环境与资源实验室”,乌鲁木齐 830054

Inversion of soil salinity of an oasis in an arid area based on Landsat8 OLI images

HUANG Xiaoyu,1, WANG Xuemei,1,2, KAWUQIATI Baishan1

1. College of Geographic Science and Tourism, Xinjiang Normal University, Urumqi 830054, China

2. Xinjiang Uygur Autonomous Region Key Laboratory “Xinjiang Arid Lake Environment and Resources Laboratory”, Urumqi 830054, China

通讯作者: 王雪梅(1976-),女,教授,博士,硕士生导师,研究方向为干旱区资源环境遥感技术应用研究。Email:wangxm_1225@sina.com

责任编辑: 陈理

收稿日期: 2022-02-11   修回日期: 2022-05-21  

基金资助: 新疆维吾尔自治区自然科学基金项目“和田地区土地荒漠化时空演变及预警研究”(2020D01A79)
国家自然科学基金项目“塔里木盆地北缘绿洲-荒漠过渡带植被对土壤盐渍化的响应研究”(41561051)

Received: 2022-02-11   Revised: 2022-05-21  

作者简介 About authors

黄晓宇(1995-),男,硕士研究生,研究方向为资源环境遥感。Email: 18699576547@163.com

摘要

利用遥感技术进行土壤含盐量的快速检测可为土壤盐渍化治理和绿洲农业合理开发提供科学指导。基于渭干河—库车河三角洲绿洲采集的95个土壤样品,采用光谱指数、波段反射率与实测土壤含盐量,运用多元线性回归、偏最小二乘回归、支持向量机回归和随机森林回归方法构建土壤含盐量估测模型,并利用最优估测结果对研究区土壤含盐量的空间分布格局进行遥感反演。结果表明: 通过全子集回归法筛选出与土壤含盐量相关显著的9个光谱因子,相关系数均在0.5以上(P<0.01)。其中盐分指数中SI-T与土壤含盐量的相关系数最大为0.648; 对比4种反演模型的估测精度,拟合的效果由高到低依次为随机森林回归>支持向量机回归>偏最小二乘回归>多元线性回归。其中随机森林模型拟合精度表现最佳,训练集和验证集的决定系数分别为0.870和0.766; 相对分析误差分别为2.792和2.105,值均大于2,表明模型反演效果较好,有稳定的估测能力; 由随机森林模型的反演结果来看,第Ⅰ等级和第Ⅱ等级占比达到41.62%,分布于绿洲内部的耕作区; 第Ⅲ,Ⅳ和第Ⅴ等级区共占比56.41%,主要分布在绿洲外围与沙漠的交错带和荒漠区。采用随机森林机器学习建模方法对土壤含盐量进行反演,估测效果明显优于传统的统计模型,可为干旱区绿洲土壤盐渍化监测提供参考。

关键词: 光谱指数; 机器学习模型; 土壤含盐量; 遥感反演; 干旱区绿洲

Abstract

The rapid detection of soil salinity using remote sensing technology can scientifically guide the soil salinization control and the rational development of oasis agriculture. Based on 95 soil samples from the oasis of the Weigan-Kuqa River delta, this study established four soil salinity estimation models of multiple linear regression, partial least squares regression (PLSR), support vector machine regression (SVR), and random forest regression using the spectral index, band reflectance, and the measured soil salinity. Then, it conducted the remote sensing inversion for the spatial distribution pattern of the soil salinity in the study area using the optimal estimation results. The results are as follows: ① Nine spectral factors that were significantly related to soil salinity were screened using the all-subsets regression method, with correlation coefficients of all above 0.5 (P < 0.01). Among them, the correlation coefficient between salinity index SI-T and the soil salinity was the highest (0.648); ② The comparison of estimation precision show that the fitting effect of the four inversion models was in the order of random forest regression > SVR > PLSR > multiple linear regression. Among these models, the random forest model had the best fitting precision. Its training and validation sets had coefficients of determination(R2) of 0.870 and 0.766, respectively, with relative percent deviation (RPD) of 2.792 and 2.105, respectively, both of which were greater than 2. These results indicate that the random forest model had a good inversion effect and stable estimation capacity; ③ According to the inversion results of the random forest model, grade I and II zones account for 41.62% and are distributed in the cultivated land area inside the oasis; grade III, IV, and V zones account for 56.41% and are primarily distributed in the desert and the desert-oasis ecotones. Therefore, compared with conventional statistical models, the random forest modeling method can yield significantly better estimation effects in the inversion of soil salinity. This study can be used as a reference for the monitoring of soil salinization in oases in arid areas.

Keywords: spectral index; machine learning model; soil salinity; remote sensing inversion; oasis in an arid area

PDF (3922KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

黄晓宇, 王雪梅, 卡吾恰提·白山. 基于Landsat8 OLI影像干旱区绿洲土壤含盐量反演[J]. 自然资源遥感, 2023, 35(1): 189-197 doi:10.6046/zrzyyg.2022047

HUANG Xiaoyu, WANG Xuemei, KAWUQIATI Baishan. Inversion of soil salinity of an oasis in an arid area based on Landsat8 OLI images[J]. Remote Sensing for Land & Resources, 2023, 35(1): 189-197 doi:10.6046/zrzyyg.2022047

0 引言

土壤盐渍化是干旱和半干旱地区的主要灾害之一,是绿洲生态系统退化的一个重要特征,受气候变化和人类不合理开发利用的影响,继而危害周围环境和农业生产[1-3]。“十四五”规划明确了我国经济社会发展要深入开展土壤污染防治,指出开展土壤盐渍化防治是农业可持续发展的必由之路。土壤盐渍化会使土壤结构遭到破坏,抑制农作物的正常生长,导致农作物产量下降,进而导致土地荒漠化的形成,最终将会威胁到人类的生存[4-6]。土壤含盐量(soil salt content,SSC)是土壤盐渍化形成的来源,准确了解SSC的空间分布和变化特征对治理土壤盐渍化具有重要意义。获取SSC的传统方法是通过野外实地采集样本数据并进行室内化学分析,该方法需要大量样点数据才能合理解释区域土壤盐渍化状况,工作量大且耗时耗力。利用遥感技术进行区域尺度SSC的快速检测,对区域土壤盐渍化的动态监测与防治具有十分重要的现实意义[7]

目前,利用遥感光谱指数构建反演模型获取某一区域土壤盐渍化信息已成为遥感技术在土壤盐渍化研究中的热点。多位学者利用与土壤盐渍化程度相关性较高的多光谱遥感指数构建盐渍化预测模型进而实现对土壤盐渍化的监测[7-8]。起初有学者采用传统的统计分析建模方法,张素铭等[9]采用波段和敏感波段组合的方法建立的多元线性回归(multiple linear regression,MLR)模型效果最好; 周晓红等[10]对艾比湖湿地自然保护区基于多光谱遥感指数分别与土壤盐分建立多种线性回归模型; 张同瑞等[11]通过植被指数和实测SSC构建线性、二次和三次函数等模型估测黄河三角洲的SSC; 而奚雪等[12]针对黄河三角洲滨海盐渍土问题,基于多光谱指数采用稳定性和适宜性更好的偏最小二乘法建立土壤反演模型。后来随着建模方法的改进,有学者运用机器学习建模方法,陈红艳等[13]基于改进后的多光谱植被指数,采用支持向量机回归(support vector machine regression,SVMR)对黄河入海口处土壤盐分进行遥感反演; Fathizad等[14]针对伊朗中部沙漠的土壤盐分问题,基于Landsat8 OLI影像提取的植被盐分指数,利用随机森林回归(random forest regression,RFR)模型反演出沙漠的土壤盐分。从上述研究可以看出,采用多光谱遥感指数构建SSC反演模型是一个非常重要的研究方向,从传统统计分析方法到机器学习建模方法的改进对促进遥感技术在环境监控等方面具有非常重要的作用。

基于此,本研究选取典型的干旱区绿洲耕层土壤作为研究对象,采用多光谱遥感指数和光谱反射率并结合传统统计分析模型和机器学习模型进行SSC的估测,基于最佳反演模型对研究区土壤盐渍化的空间分布特征进行研究。

1 研究区概况及数据源

1.1 研究区概况

渭干河—库车河三角洲绿洲(简称渭—库绿洲)位于新疆南部塔里木盆地的中北部(图1),属于典型的温带大陆性气候。多年平均气温为11.6 ℃,多年平均降水量为52 mm,蒸降比为54∶1。自然条件下,植被盖度较低且多为盐生植被,如芦苇、柽柳、骆驼刺、胡杨、盐节木、盐穗木、盐爪爪、花花柴、苦豆子、白刺和黑刺等。研究区土壤以棕漠土、灌淤土、沼泽土、盐土和风沙土为主。由于该区域自然环境脆弱,加之人为不合理的农业管理,使该地区土壤盐渍化现象发生较为普遍,且存在大面积的潜在次生盐渍化土壤,严重影响了该区域的生态环境,导致绿洲土地退化问题日益严峻,绿洲农业的可持续发展受到了严重威胁[15]

图1

图1   研究区采样点分布

Fig.1   Distribution of sampling points in the study area


1.2 土样采集与遥感影像预处理

渭—库绿洲夏季蒸发量高能突显地表SSC的特征,因此土壤样品采集工作在2019年7月中下旬进行。利用 GPS在绿洲不同盐渍化区域进行随机定位,选取样点进行采样。通过剔除,共选取了95个样点,采样深度为0~20 cm。将采集的土样在实验室进行自然风干,剔出杂质,通过磨细过筛,充分混合均匀进行分析。按照土水比1∶5浸提后,使用电导率仪测定土壤电导率、SSC和土壤含水量。土壤检测的标准方法采用NY/T 1121.16—2006土壤水溶性总盐。结合研究区地理位置,选取云量较少,与采样时间同期的Landsat8影像,使用ENVI 5.3软件和R语言对影像进行辐射定标和大气校正等预处理,提取遥感光谱指数和波段反射率。

2 研究方法

2.1 遥感光谱指数计算

光谱指数选取与SSC有相关性的植被指数、盐分指数和波段反射率[16],如表1所示,分别为归一化植被指数(normalized difference vegetation index,NDVI)、扩展增强型植被指数(extended normalized difference vegetation index,ENDVI)、差值植被指数(difference vegetation index,DVI)、冠层响应盐度指数(canopy response salinity index,CRSI)、增强型植被指数(enhanced vegetation index,EVI)、扩展增强型植被指数(extended enhanced vegetation index,EEVI)、归一化盐分指数(normalized difference salinity index,NDSI)、多种盐分指数S3,S5,SI4和SI-T。

表1   光谱指数计算公式

Tab.1  Calculation formulas of spectral indexes

光谱指数计算公式参考文献
NDVINDVI=(NIR-Red)/(NIR+Red)[10]
ENDVIENDVI=(NIR+SWIR2-Red)/(NIR+SWIR2+Red)[10]
DVIDVI=NIR-Red[10]
CRSICRSI=[(NIR·Red-Green·Blue)/(NIR·Red+Green·Blue)]0.5[15]
EVIEVI=2.5[(NIR-Red)/(NIR+6Red-7.5Blue+1)][12]
EEVIEEVI=2.5[(NIR+SWIR1-Red)/(NIR+SWIR1+6Red-7.5Blue+1)][12]
NDSINDSI=(Red-NIR)/(Red+NIR)[17]
S3S3=(Green·Red)/Blue[17]
S5S5=(Blue·Red)/Green[17]
SI4SI4=(Green2+Red2)0.5[10]
SI-TSI-T=(Red/NIR)×100[18]

①式中: Blue为蓝光波段反射率; Green为绿光波段反射率; Red为红光波段反射率; NIR为近红外波段反射率; SWIR1为短波红外1波段反射率; SWIR2为短波红外2波段反射率。

新窗口打开| 下载CSV


2.2 SSC反演模型

由于统计分析建模方法有直观的理解和解释,而机器学习建模方法能够有效地解决非线性问题。本研究以筛选的光谱指数和波段反射率作为反演模型的自变量,SSC为因变量,采用MLR、偏最小二乘回归(partial least squares regression,PLSR)、SVMR和RFR模型,通过R语言和Matlab软件实现模型的构建和验证。MLR是指2个或多个变量的回归分析,MLR是一元线性回归的扩展,相比较能够充分展示各变量之间的相互关系,更能反映变量的真实情况。PLSR用于解决多对多线性回归的问题,尤其是当变量个数较多且存在多重相关性时,其分析过程集中了主成分分析和线性回归分析等特点。SVMR基于统计学习理论是一种相对简单的监督机器学习方法,能够从理论上实现对不同类别进行最优分类,通过建立核函数,寻找超平面,将用于分类问题的损失函数稍加改动,可用于回归问题。RFR是1995年由贝尔实验室提出的,由许多决策树组成,是目前流行的机器学习模型之一。

2.3 模型精度评价

为了评价反演模型的效果,采用决定系数R2、均方根误差RMSE和相对分析误差RPD进行精度评价。其中R2越大,表明模型的拟合程度越好。RMSE越小,表明模型的预测精度较高。RPD用以衡量模型的预测能力,当RPD<1.4时认为所建模型预测结果较差; 当1.4≤RPD<2.0时认为所建模型预测结果基本满意; 当RPD≥2.0时可认为所建模型的预测结果较好[19]。各检验指标表达式分别为:

R2=1-i=1n(yi^-yi)2i=1n(yi-y-)2
RMSE=1ni=1n(yi^-yi)2
RPD=SDRMSE

式中: n为采样点数量; yi^为土壤样点i的预测值,yi为土壤样点i的实测值; y-为土壤样点实测值的平均值; SD为数据的标准差。

3 结果与分析

3.1 SSC的特征分析

将研究区采集的95个实测样点进行随机抽样,划分出70%的样本作为训练样本,剩余为验证样本,并进行描述性统计(表2)。分析得出研究区土壤样本SSC在0.525~216.375 g·kg-1区间变化。总体样本、训练样本和验证样本的平均值分别为26.349 g·kg-1,25.576 g·kg-1和28.108 g·kg-1,说明SSC主要集中分布在26.349 g·kg-1左右。变异系数是反映样本数据的离散程度,3种样本的变异系数均大于100%,表明研究区SSC的离散程度较大,属于高度空间变异; 同时也反映出研究区SSC空间分布不均,变化波动较大。

表2   土壤样本基本统计特征

Tab.2  Basic statistical characteristics of soil samples

样本类型样本
数/个
SSC/(g∙kg-1)变异系
数/%
最大值最小值平均值标准差
总体样本95216.3750.52526.34942.648161.859
训练样本66216.3750.52525.57643.265169.159
验证样本29145.3250.82528.10841.908149.098

新窗口打开| 下载CSV


根据研究区土壤SSC的实际分布情况,基于乔木等[20]研究中的SSC分级,制定了本研究SSC分级标准(表3)。实测样点的SSC在5种等级中均有分布,有58.95%的实测样点位于第Ⅰ等级区域中,该区域大部分以农作物为主; 第Ⅱ等级区域主要以农作物和草本为主并有17.89%的实测样点分布其中; 第Ⅲ和Ⅳ等级区域主要以草本和灌木等植被为主并有14.74%的实测样点分布其中,而第Ⅴ等级区域实测样点较少只有8.42%的实测样点分布其中,植被类型以灌木和乔木为主。

表3   SSC分级标准

Tab.3  Classification standard of SSC

等级SSC/
(g∙kg-1)
地表植被植被类型生长情况
<10小麦、玉米和棉花等农作物以及红枣和核桃等经济作物不受抑制
[10,35)以棉花等农作物以及芦苇等草本等为主稍有抑制
[35,60)芦苇、白刺等草本以及盐穗木、盐节木等灌木中等抑制
[60,85]盐穗木、盐节木等灌木以及柽柳、胡杨等乔木严重抑制
>85以盐穗木、柽柳和胡杨等乔木为主极严重抑制

新窗口打开| 下载CSV


3.2 建模变量筛选

本研究的变量包括6个植被指数、5个盐分指数和7个波段反射率,共18个建模变量。将建模变量分别与SSC作相关性分析如表4所示,可以看出,NDVI,ENDVI,DVI,EVI,EEVI,NDSI,S3,S5,SI4,SI-T,红光波段反射率、短波红外1波段反射率和短波红外2波段反射率均与SSC的相关性较强,在P<0.01水平上具有显著相关性; 其次是CRSI、海岸波段反射率、蓝光波段反射率、绿光波段反射率、近红外波段反射率与SSC的相关性较弱,但同样在P<0.01水平上显著相关。

表4   建模变量与SSC的相关性

Tab.4  Correlation between modeling variables and SSC

变量NDVIENDVIDVICRSIEVIEEVINDSIS3S5
相关系数-0.637**①-0.605**-0.607**-0.504**-0.619**-0.601**0.637**0.636**0.625**
变量SI4SI-T海岸波段蓝光波段绿光波段红光波段近红外波段短波红外1波段短波红外2波段
相关系数0.614**0.648**0.535**0.551**0.577**0.632**-0.523**0.638**0.657**

①**表示在0.01水平极显著相关。

新窗口打开| 下载CSV


在多变量回归中,为了得到一个简洁有效的预测模型,通常需要进行变量筛选。统计学中常用的变量筛选方法有逐步回归(向前法、后退法),但由于逐步回归法的局限性,不能保证对建模变量的每一个组合进行评估,而全子集回归法则可以一次性对所有可能的建模变量组合进行检验。研究中使用R语言leaps包中的regsubsets函数,采用全子集回归法的adjr2(调整的R2)参数标准,实现最优建模变量组合的筛选。当考虑CRSI和EEVI作为建模变量时,adjr2值为0.47; 当考虑SI4、蓝光波段反射率和短波红外2波段反射率作为建模变量时,adjr2值为0.49; 当考虑DVI,CRSI,EEVI,NDSI,S3,S5,SI-T,蓝光波段反射率和短波红外1波段反射率作为建模变量时,adjr2值达到最大,为0.51。选择将adjr2参数达到最大时的变量组合作为最佳建模变量。

3.3 多光谱遥感光谱指数特征分析

依据筛选出与SSC相关性高的建模变量包括DVI,CRSI,EEVI,NDSI,S3,S5,SI-T,蓝光波段反射率和短波红外1波段反射率,并获得各建模指标的空间分布如图2所示。

图2

图2   光谱指数与光谱反射率空间分布

Fig.2   Spatial distributions of spectral index and spectral reflectance


图2可以看出光谱指数和波段反射率能够反映出该荒漠绿洲地表的光谱特征,由于植被对近红外波段有强烈的反射作用,致使EEVI和CRSI中绿洲内部呈现出较于绿洲外围荒漠部分更高的数值,而DVI中荒漠和绿洲有明显的差距,是因为植被对红光强烈吸收而近红外强烈反射,因此DVI中会发现绿洲和荒漠有清晰的边界; 盐分指数S3和S5中绿洲内部指数值较低,是由于植被对蓝光和红光强烈吸收作用; NDSI中绿洲内部反映出的低值与绿洲外部相反,越有植被覆盖的地区值越低; SI-T中绿洲外围的指数值远远高出内部的值; 蓝光波段反射率中绿洲内部相比绿洲外围荒漠带反射率要低,荒漠带植被覆盖较少,光谱反射特征与裸土相近,绿洲外围的西南部分土壤颜色较浅,波段反射率较高; 短波红外1波段反射率相比蓝光波段反射率,绿洲内的植被有较高的反射率,但依旧低于外围的反射率,可能是外围土壤位于荒漠平原颗粒细小,表面平滑,导致具有较高的反射率。结合表4图2对SSC进行定性分析,DVI,EEVI和CRSI指数中绿洲内部均与SSC呈负相关,指数值越高SSC越低,而绿洲外围反之。CRSI指数显示,绿洲内部指数值较高可能造成SSC较低,而DVI指数中绿洲外围与沙漠的交错带出现极低的负值表明外围部分SSC可能会很高。其余6个变量均与SSC呈正相关,与图中呈现的结果一致,指数值越小的区域SSC较低,指数值越大的地区SSC较高。

3.4 SSC反演模型的构建与验证

在相关性分析和对研究区SSC定性分析的基础上,将DVI,CRSI,EEVI,NDSI,S3,S5,SI-T,蓝光波段反射率和短波红外1波段反射率与SSC进行统计分析回归建模和机器学习回归建模分析,由此分别构建MLR,PLSR,SVMR和RFR这4种反演模型,通过R2,RMSERPD对SSC估测结果进行评价,从而寻找出最佳的SSC反演模型,精度对比结果如表5所示。

表5   反演模型的精度对比

Tab.5  Accuracy comparison of inversion models

建模方法训练集验证集
R2RMSE/
(g·kg-1)
RPDR2RMSE/
(g·kg-1)
RPD
MLR0.4803.0981.3970.5992.6081.607
PLSR0.4743.1141.3900.7212.5121.669
SVMR0.5752.8011.5450.5942.6241.598
RFR0.8701.5502.7920.7661.9912.105

新窗口打开| 下载CSV


MLR模型使用R语言包stats中的lm函数对训练集进行建模,结果表明,模型整体检验是显著的,因此可以解释因变量的变化。通过MLR模型的训练集和验证集的预测结果,可知训练集的R2RMSE分别为0.480和3.098 g·kg-1。研究中利用plsregress函数对PLSR模型进行训练,通过不断尝试,确定参数ncomp=8时,前3个主成分分量的贡献率分别为77.34%,9.13%和5.69%,可以看出前3个主成分累计贡献率为92.16%,模型的精度较好。将训练集和验证集数据使用模型预测,可得训练集的R2RMSE分别为0.474和3.114 g·kg-1。SVMR模型的性能取决于核函数及其参数的选择,构建模型使用R语言包e1071,通过训练认为径向基函数radial作为核函数效果最佳,costgamma是非线性SVM重要的参数,使用tune函数对模型进行优化以寻找最优参数,结果表明。优化后的SVMR模型参数为cost=11,gamma=0.09,epsilon=0.1,且使用40个支持向量,分别在训练集和验证集上进行预测。并计算训练集和验证集上的平均绝对值误差,结果显示训练集上的绝对误差为1.302,验证集上的绝对误差为1.569。通过计算得出训练集的R2RMSE分别为0.575和2.801 g·kg-1。RFR模型则使用R语言包randomForest进行训练,并指定决策树数目ntree=500。使用训练好的回归模型对验证集进行预测,可以发现,在验证集上的预测RMSE只有2.178 g·kg-1,这个结果较MLR,PLSR和SVMR模型的验证集精度要高。但模型的性能除了与ntree有关,还取决于每个决策树包含的变量个数mtry,通过使用tuneRF函数进一步优化RFR模型,来寻找更优的模型参数mtry,结果表明,OOBError取值最小时,mtry=3。再次对验证集进行预测,RMSE只有1.991 g·kg-1,预测误差大大减小,模型的精度得到提升。

通过比较4种模型在训练集中的精度,统计分析建模方法与机器学习建模方法在R2方面存在显著差异,R2最大的是RFR模型为0.870,其次是SVMR模型为0.575,与SVMR模型相比R2提高了51.30%,而MLR和PLSR模型R2偏低,分别为0.480和0.474。在RMSE方面,MLR和PLSR模型基本一致,分别为3.098和3.114,RFR模型最低为1.550,具有最佳的拟合性能,而SVMR模型处于二者之间。与其他3个模型相比,RFR模型表现非常好,RMSE平均降低了48.4%。在验证集中,RFR模型具有最大的R2和最小的RMSE; SVMR模型的估测能力与MLR模型相似,但低于PLSR模型。此外,MLR,PLSR和SVMR模型验证集的RPD值均位于1.4~2.0之间,表明这3种模型的预测能力基本可以达到令人满意的结果,可勉强用于SSC的估测。然而,RFR模型的训练集和验证集的RPD分别为2.792和2.105,均大于2,说明RFR模型具有良好的估测能力,能够准确地估测出研究区的SSC。综上分析认为,RFR模型的拟合能力显著优于MLR,PLSR和SVMR模型。

基于不同反演模型训练集和验证集的实测值与估测值的散点图如图3所示。结合表3的分级标准,从图3中可以看出,训练集和验证集的样点数据均在各个等级内有分布,突出模型的可行性。从散点的分布来看,RFR模型的散点大致在1∶1线附近,说明模型的估测值接近于实测值,SVMR模型少数散点有偏离的倾向,而从MLR模型和PLSR模型的散点图来看,有较大范围的样本点存在偏离1∶1线的趋势。以总体样本的实测值和估测值计算R2RMSE,可以发现RFR模型的预测能力最佳,其R2为0.861,SVMR模型次之,其R2为0.644,同样具有良好的预测能力,而MLR和PLSR模型的R2分别为0.521和0.525,模型预测能力一般,综上分析认为,4种反演模型估测效果的优劣排序依次为RFR>SVMR>PLSR>MLR。

图3

图3   SSC不同反演模型的实测值-估测值散点图

Fig.3   Scatter plots of measured and estimated values for different inversion models of SSC


3.5 土壤盐渍化空间反演

依据上述建模结果,由于RFR建模方法反演的效果要优于其他建模方法,因此,本研究采用RFR反演模型使用R语言编程结合影像数据对研究区的SSC进行空间反演,并依据表3分级标准,获得研究区SSC等级的空间分布情况(图4)。

图4

图4   研究区SSC空间分布

Fig.4   Spatial distribution of SSC in the study area


图4中可以看出,研究区SSC在空间上大致呈现出绿洲内部SSC较低,而绿洲外围SSC较高的分布特征。此外,SSC的等级分布存在明显的空间分异,这与地表覆盖密切相关,而建模的光谱因子中,植被指数和盐分指数能够突显出土地覆盖的空间差异,所得到的反演结果与地表实际状况吻合。SSC的空间分布整体表现为自绿洲向外围逐渐增加的趋势,具体等级空间分布位置以及面积占比为: 第Ⅰ等级分布在绿洲耕地区内部,所占比例最大,为31.87%; 第Ⅱ等级大多呈零星状镶嵌分布在绿洲耕地区,占研究区总面积较小,为9.75%; 第Ⅲ等级较多分布在绿洲外围的西南部和东南部,其余较少分布在绿洲内部,占研究区总面积的27.48%; 第Ⅳ等级分布在绿洲边缘和沙漠的交错带之间,占研究区总面积的22.83%; 第Ⅴ等级集中分布在绿洲外围东部库车河冲积扇区域,占比较小,为6.10%。绿洲内部SSC较低,而外围SSC较高,这是由于夏季农田植被覆盖程度较高,而蒸发量相对于外围荒漠区域较低。此外,绿洲外围SSC较高的区域集中分布在东部库车河冲积扇区域,稍低的区域分布在东南部且靠近河流水系的集中区域,主要是由于该区地势呈北高南低,SSC多积聚于地势较低的冲积扇区域,且地下水和河流汇集在下游,蒸发量高,这也是导致绿洲外围SSC高的原因之一。

4 讨论

本文结果表明干旱区绿洲SSC主导因子主要是植被指数和盐分指数,由于植被与土壤存在密切关系,通过植被的生长状况可间接地反映出盐分的分布特点,因此将遥感光谱指数作为训练模型的输入变量。陈红艳等[13]、张智韬等[21]和苏雯等[22]通过提取遥感光谱指数DVI,CRSI,EEVI和SI-T进行SSC反演取得了较好的效果; 厉彦玲等[23]的研究进一步发现土壤盐渍化程度低的区域光谱反射率高,适合进行盐分空间反演。许多学者的研究表明运用机器学习建模比线性关系预测的精度更高,在本文中机器学习建模同样比传统统计方法建模精度高,这也反映出植被指数和盐分指数与SSC呈现的是非线性关系。同时相比传统统计方法,在空间分布上也较清晰地表征出其变化特点和趋势。

本研究通过建立SSC与基于全子集回归法筛选的相关性较高的多光谱遥感指数,分别建立4种不同的回归模型,进而选择合适的建模变量和拟合度最佳的回归模型方法,构建的RFR模型可精确定量反演研究区的SSC。从杨练兵等[24]与冯娟等[25]前期的研究来看,研究区内非盐渍土和盐渍化程度较轻的地区位于绿洲的内部,而绿洲外围的盐渍化程度较为严重,本研究反演结果与上述研究结果基本保持一致。由于土壤盐渍化是一个复杂的地表过程,利用光谱指数和光谱反射率进行SSC的定量反演将面临诸多困难。综合利用多源遥感数据结合深度学习模型提高SSC的估测精度,将会是未来SSC定量反演的趋势。

5 结论

以渭干河—库车河绿洲为研究区,利用野外实地测量,并结合从多光谱遥感影像中提取的多种遥感光谱指数,选出与SCC相关性较高的指数与其实地测量数据分别构建4种回归反演模型预测SSC,探索最佳SSC反演模型并实现非线性地理模型在空间尺度上的可视化,可得到如下结论:

1)基于野外采样点数据结合Landsat8影像提取的光谱指数和波段反射率,通过全子集回归法筛选出用于建模的差值植被指数DVI、冠层响应盐度指数CRSI、扩展增强型植被指数EEVI、归一化盐分指数NDSI、盐分指数S3、盐分指数S5、盐分指数SI-T、蓝光波段反射率和短波红外1波段反射率,这9个变量均与SSC呈显著的相关关系(P<0.01)。

2)通过对比4种建模方法的估测结果,RFR模型精度最高,SVMR模型次之,PLSR和MLR模型精度最低。最佳模型为RFR模型,其训练集R2,RMSERPD分别为0.870,1.550 g·kg-1和2.792,验证集R2,RMSERPD分别为0.766,1.991 g·kg-1和2.105,模型估测能力较强,对SSC的反演具有较高的准确性。

3)通过最佳模型对研究区SSC进行空间反演分析,该区土壤盐渍化呈现出“内低外高”的空间分异。绿洲内部SSC较低,主要以第Ⅰ等级和第Ⅱ等级为主,占研究区总面积的41.62%; 绿洲外围SSC较高,以第Ⅲ,Ⅳ和Ⅴ等级为主,共占研究区总面积的56.41%。

参考文献

Abuelgasim A, Ammad R.

Mapping soil salinity in arid and semi-arid regions using Landsat8 OLI satellite data

[J]. Remote Sensing Applications: Society and Environment, 2019, 13:415-425.

DOI:10.1016/j.rsase.2018.12.010      URL     [本文引用: 1]

Abdennour M A, Douaoui A, Piccini C, et al.

Predictive mapping of soil electrical conductivity as a Proxy of soil salinity in south-east of Algeria

[J]. Environmental and Sustainability Indicators, 2020, 8:100087.

DOI:10.1016/j.indic.2020.100087      URL     [本文引用: 1]

Eswar D, Karuppusamy R, Chellamuthu S.

Drivers of soil salinity and their correlation with climate change

[J]. Current Opinion in Environmental Sustainability, 2021, 50:310-318.

DOI:10.1016/j.cosust.2020.10.015      URL     [本文引用: 1]

Khadim F K, Su H, Xu L, et al.

Soil salinity mapping in Everglades National Park using remote sensing techniques and vegetation salt tolerance

[J]. Physics and Chemistry of the Earth, 2019, 110:31-50.

DOI:10.1016/j.pce.2019.01.004      [本文引用: 1]

Everglades National Park (ENP) is a hydro-ecologically enriched wetland with varying salinity contents, which is a concern for terrestrial ecosystem balance and its nearby urban sustainability. In this study, spatio-temporal soil salinity maps are created using remote sensing techniques, coupled with literature review to understand vegetation salt tolerance properties, and field assessments entailing insitu electric conductivity (EC) measurements. The mapping first entailed the execution of a supervised machine learning technique-the maximum likelihood classification algorithm-to delineate seven vegetation-based land cover classes for the area, namely, mangrove forest, mangrove scrub, low-density forest, sawgrass, prairies and marshes, barren lands with woodland hammock and water, for the years 1996, 2000, 2006, 2010 and 2015. The classifications for 1996-2010 yielded accuracies of 82%-94%, and the 2015 classification was supported through ground truthing. Afterwards, EC tolerance thresholds for each vegetation class were established, which yielded soil salinity maps comprising four soil salinity classes-i.e., the non- (EC = 0-2 dS/m), low- (EC = 2-4 dS/m) and high-saline (EC >= 4 dS/m) areas. The soil salinity maps visualized the spatial distribution of soil salinity with no significant temporal changes. Furthermore, insitu EC measurements carried out at 23 sampling sites covering all land cover classes mostly validated (91% samples were tested within range) the estimated soil salinity ranges for the latest distribution. The approach of using land cover classes to sense salinity ranges in an urban-proximal ecosystem is pragmatic and application oriented, attributing to novel and useful study upshots considering the diversifying ecological context.

Hammam A A, Mohamed E S.

Mapping soil salinity in the East Nile Delta using several methodological approaches of salinity assessment

[J]. The Egyptian Journal of Remote Sensing and Space Science, 2020, 23(2):125-131.

DOI:10.1016/j.ejrs.2018.11.002      URL     [本文引用: 1]

王遵亲, 祝寿泉, 俞仁培, . 中国盐渍土[M]. 北京: 科学出版社, 1993:7-78.

[本文引用: 1]

Wang Z Q, Zhu S Q, Yu R P, et al. Chinese saline soil[M]. Beijing: Science Press, 1993:7-78.

[本文引用: 1]

周磊, 贺聪聪, 吕爱锋, .

柴达木盆地土壤盐渍化程度快速动态监测

[J]. 测绘科学, 2021, 46(7):99-106,114.

[本文引用: 2]

Zhou L, He C C, Lyu A F, et al.

Research on quick dynamic monitoring of soil salinization in Qaidam Basin

[J]. Science of Surveying and Mapping, 2021, 46(7):99-106,114.

[本文引用: 2]

张荣群, 乔月霞, 薛佳妮.

银川平原土壤盐渍化与土地利用强度的空间关联分析

[J]. 地球信息科学学报, 2015, 17(5):598-606.

DOI:10.3724/SP.J.1047.2015.00598      [本文引用: 1]

银川平原盐渍土时空格局及其与土地利用强度变化关联关系的空间区位特征,可从土地利用强度的角度阐释土壤盐渍化的动因,为盐渍化因地制宜的治理提供参考依据。本文重点研究了盐渍土空间分布定量遥感生成方法,通过土地利用遥感制图、半方差函数的地统计学方法和灰色关联度分析法,对2004-2010 年银川平原的土地利用强度变化、土壤盐渍化程度变化及各类盐渍土与土地利用强度的关联度,进行了空间区位分布特征的可视化表达。研究结果表明:银川平原的发展仍具集聚效应,土地利用强度变化与城镇体系格局、交通干线、沟渠分布、土壤盐分含量密切相关;2004-2010 年间,银川平原土壤盐渍化存在整体减轻、局部加重的空间分布特征,与土地利用强度变化间的响应关系,存在较明显的空间差异;银川平原土壤盐渍化程度变化与土地利用强度变化间的关联度为0.7781,与水体、耕地这2 种土地类型间的关联程度最高。银川平原土壤盐渍化的干扰活动中,水体与耕地类型的利用行为是较重要的影响因子。

Zhang R Q, Qiao Y X, Xue J N.

Spatial relationship analysis between the soil salinization and land use intensity in Yinchuan Plain

[J]. Journal of Geo-Information Science, 2015, 17(5):598-606.

[本文引用: 1]

张素铭, 赵庚星, 王卓然, .

滨海盐渍区土壤盐分遥感反演及动态监测

[J]. 农业资源与环境学报, 2018, 35(4):349-358.

[本文引用: 1]

Zhang S M, Zhao G X, Wang Z R, et al.

Remote sensing inversion and dynamic monitoring of soil salt in coastal saline area

[J]. Journal of Agricultural Resources and Environment, 2018, 35(4):349-358.

[本文引用: 1]

周晓红, 张飞, 张海威, .

艾比湖湿地自然保护区土壤盐分多光谱遥感反演模型

[J]. 光谱学与光谱分析, 2019, 39(4):1229-1235.

[本文引用: 5]

Zhou X H, Zhang F, Zhang H W, et al.

A study of soil salinity inversion based on multispectral remote sensing index in Ebinur Lake wetland nature reserve

[J]. Spectroscopy and Spectral Analysis, 2019, 39(4):1229-1235.

[本文引用: 5]

张同瑞, 赵庚星, 高明秀, .

基于近地面多光谱的黄河三角洲典型地区土壤含盐量估算研究

[J]. 光谱学与光谱分析, 2016, 36(1):248-253.

[本文引用: 1]

Zhang T R, Zhao G X, Gao M X, et al.

Soil salinity estimation based on near-ground multispectral imagery in typical area of the Yellow River Delta

[J]. Spectroscopy and Spectral Analysis, 2016, 36(1):248-253.

[本文引用: 1]

奚雪, 赵庚星, 高鹏, .

基于Sentinel卫星及无人机多光谱的滨海冬小麦种植区土壤盐分反演研究——以黄三角垦利区为例

[J]. 中国农业科学, 2020, 53(24):5005-5016.

DOI:10.3864/j.issn.0578-1752.2020.24.004      [本文引用: 3]

【目的】探究黄河三角洲麦田土壤盐分准确高效的遥感提取方法,掌握土壤盐渍化程度与分布。【方法】以垦利区为研究区,均匀布设冬小麦种植区样点77个,同时设置代表性试验区2个,网格布设样点99个,实测采集麦田土壤表层盐分数据及试验区无人机多光谱图像。筛选红、绿、红边、近红4个波段及SI、NDVI、DVI、RVI、GRVI 5个光谱指数中的敏感光谱参量,采用逐步回归、偏最小二乘法、BP神经网络及SVM支持向量机4种方法建立土壤盐分估测模型,使用波段比值均值法得到Sentinel-2A卫星影像相应波段的修正系数,进而将筛选的土壤盐分估测模型转换为基于卫星影像的反演模型,经麦区实测样点数据验证,得到最佳的麦区土壤盐分反演模型,实现试验区和研究区2个尺度的麦田土壤盐分反演。【结果】无人机4个波段及光谱指数NVDI、RVI、SI与土壤盐分含量相关性显著,4种建模方法的13个模型中,以NDVI、RVI、SI建立的4个指数模型的建模及验证R<sup>2</sup>均优于其他模型;对4个模型进行升尺度修正及验证,效果最佳的反演模型为偏最小二乘法光谱指数模型:Y=-9.4774×NDVI<sub>1</sub>+0.4794×RVI<sub>1</sub>+3.0747×SI<sub>1</sub>+5.0604,验证R<sup>2</sup>为0.513,RMSE为1.379;利用该模型反演得到了试验区及整个研究区麦田土壤盐分等级分布图,结合实测插值及调查结果,证明反演模型及空间分布结果准确、可靠。【结论】本研究构建了卫星、无人机一体化的滨海麦区土壤盐分反演模型,对滨海盐渍区农作物的生产管理有积极参考价值。

Xi X, Zhao G X, Gao P, et al.

Inversion of soil salinity in coastal winter wheat growing area based on sentinel satellite and unmanned aerial vehicle multi-spectrum:A case study in Kenli District of the Yellow River Delta

[J]. Scientia Agricultura Sinica, 2020, 53(24):5005-5016.

[本文引用: 3]

陈红艳, 赵庚星, 陈敬春, .

基于改进植被指数的黄河口区盐渍土盐分遥感反演

[J]. 农业工程学报, 2015, 31(5):107-114.

[本文引用: 2]

Chen H Y, Zhao G X, Chen J C, et al.

Remote sensing inversion of saline soil salinity based on modified vegetation index in estuary area of Yellow River

[J]. Transactions of the Chinese Society of Agricultural Engineering, 2015, 31(5):107-114.

[本文引用: 2]

Fathizad H, Ardakani M A H, Sodaiezadeh H, et al.

Investigation of the spatial and temporal variation of soil salinity using random forests in the central desert of Iran

[J]. Geoderma, 2020, 365:114233.

DOI:10.1016/j.geoderma.2020.114233      URL     [本文引用: 1]

何宝忠, 丁建丽, 刘博华, .

渭库绿洲土壤盐渍化时空变化特征

[J]. 林业科学, 2019, 55(9):185-196.

[本文引用: 2]

He B Z, Ding J L, Liu B H, et al.

Spatiotemporal variation of soil salinization in Weigan-Kuqa River delta oasis

[J]. Scientia Silvae Sinicae, 2019, 55(9):185-196.

[本文引用: 2]

Allbed A, Kumar L.

Soil salinity mapping and monitoring in arid and semi-arid regions using remote sensing technology:A review

[J]. Advances in Remote Sensing, 2013, 2:373-385.

DOI:10.4236/ars.2013.24040      URL     [本文引用: 1]

Wang J Z, Ding J L, Yu D L, et al.

Machine learning-based detection of soil salinity in an arid desert region,Northwest China:A comparison between Landsat8 OLI and Sentinel-2 MSI

[J]. The Science of the Total Environment, 2020, 707(10):136092.

DOI:10.1016/j.scitotenv.2019.136092      URL     [本文引用: 3]

Seifi M, Ahmadi A, Neyshabouri M R, et al.

Remote and Vis-NIR spectra sensing potential for soil salinization estimation in the eastern coast of Urmia hyper saline lake,Iran

[J]. Remote Sensing Applications:Society and Environment, 2020, 20:100398.

DOI:10.1016/j.rsase.2020.100398      URL     [本文引用: 1]

Liu Y, Zhang F, Wang C, et al.

Estimating the soil salinity over partially vegetated surfaces from multispectral remote sensing image using non-negative matrix factorization

[J]. Geoderma, 2019, 354:113887.

DOI:10.1016/j.geoderma.2019.113887      URL     [本文引用: 1]

乔木, 周生斌, 卢磊, .

新疆渭干河流域土壤盐渍化时空变化及成因分析

[J]. 地理科学进展, 2012, 31(7):904-910.

[本文引用: 1]

Qiao M, Zhou S B, Lu L, et al.

Causes and spatial-temporal changes of soil salinization in Weigan River basin,Xinjiang

[J]. Progress in Geography, 2012, 31(7):904-910.

[本文引用: 1]

张智韬, 杜瑜燕, 劳聪聪, .

基于雷达遥感的不同深度土壤含盐量反演模型

[J]. 农业机械学报, 2020, 51(10):243-251.

[本文引用: 1]

Zhang Z T, Du Y Y, Lao C C, et al.

Inversion model of soil salt content in different depths based on Radar remote sensing

[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(10):243-251.

[本文引用: 1]

苏雯, 丁建丽, 杨爱霞.

基于GF-1影像的渭-库绿洲外围土壤含盐量定量反演研究

[J]. 中国农村水利水电, 2017(2):9-13.

[本文引用: 1]

为探讨国产GF-1卫星影像在干旱区土壤盐渍化监测中的适用性, 本文以渭-库绿洲外围荒漠交错带为研究对象,利用BP神经网络和RBF神经网络2种建模算法,以GF-1影像的4个波段的反射率,及影像提取的归一化差异植被指数(NDVI)、差值植被指数(DVI)、土壤调节植被指数(SAVI)、及盐度指数(SI1、SI2、SI-T)共十个指标构建土壤含盐量反演模型。结果表明:(1)在2种算法中,BP神经网络模型预测精度最高,R2为0.818,RMSE为0.194。(2)发现利用植被指数更能提高模型的预测精度。(3)利用BP神经网络预测模型反演研究区的土壤含盐量,发现预测情况与研究区实际情况相符,说明利用GF-1数据结合BP神经网络构建的反演模型适用于监测研究区土壤盐渍化问题。

Su W, Ding J L, Yang A X.

Quantitative inversion of soil salinity in Weigan-Kuqa River oasis based on GF-1 image

[J]. China Rural Water and Hydropower, 2017(2):9-13.

[本文引用: 1]

The applicability of domestic GF-1 satellite images in the monitoring of soil salinization is discussed,using BP neural network andRBF neural network modeling method with ten indexes including four bands reflectance of GF-1 images、the normalized difference vegetationindex ( NDVI) 、difference vegetation index ( DVI) 、soil regulating vegetation index ( SAVI) and salinity index ( SI1,SI2,SI-T) . The resultsshow that: The BP neural network model with the highest prediction accuracy is the highest in the 2 kinds of algorithms,R2 is 0.818,RMSEis 0.194. The vegetation index can improve the prediction accuracy of the model effectively. Using BP neural network to predict the soil salinity in the study area,found that soil containing salt content is consistent with the reality of the study area. It shows that it is feasible to use GF-1 data combined with BP neural network model to monitor the salinization of study area.

厉彦玲, 赵庚星, 常春艳, .

OLI与HSI影像融合的土壤盐分反演模型

[J]. 农业工程学报, 2017, 33(21):173-180.

[本文引用: 1]

Li Y L, Zhao G X, Chang C Y, et al.

Soil salinity retrieval model based on OLI and HSI image fusion

[J]. Transactions of the Chinese Society of Agricultural Engineering, 2017, 33(21):173-180.

[本文引用: 1]

杨练兵, 陈春波, 郑宏伟, .

基于优化随机森林回归模型的土壤盐渍化反演

[J]. 地球信息科学学报, 2021, 23(9):1662-1674.

DOI:10.12082/dqxxkx.2021.200711      [本文引用: 1]

当前应用于土壤盐分含量(Soil Salinity Content, SSC)反演的随机森林回归(Random Forests Regression, RFR)较少关注对模型精度影响较大的反演参数子集和模型参数的同步优化。本研究选择渭-库绿洲和奇台绿洲为实验区,基于Landsat-5 TM、SRTM、MOD11A2.006遥感数据构建反演参数。首先,利用弹性网络(Elastic Net, EN)筛选出反演参数子集,然后利用遗传算法(Genetic Algorithm, GA)和贝叶斯优化算法(Bayesian Optimization Algorithm, BOA)分别优化随机森林回归(Random Forests Regression, RFR)参数,建立反演参数子集和模型参数分步优化的RFR模型(EN-GA-RFR、EN-BOA-RFR)。建立利用GA和BOA分别同步优化反演参数子集和模型参数的RFR模型(GA-RFR、BOA-RFR)。在每个实验区,对比EN-GA-RFR、EN-BOA-RFR、GA-RFR、BOA-RFR的预测精度。最后分析每个实验区各类盐渍土的空间分布,并对2个实验区的反演参数进行对比分析。结果表明:每个实验区模型预测精度由高到低的排序均为BOA-RFR&gt;GA-RFR&gt;EN-BOA-RFR=EN-GA-RFR,整体上BOA的优化性能均好于GA;渭-库绿洲和奇台绿洲面积占比最大的盐渍土类型分别为盐渍土和中度盐渍土;反演参数对SSC的表征能力存在空间分异性。

Yang L B, Chen C B, Zheng H W, et al.

Retrieval of soil salinity content based on random forests regression optimized by bayesian optimization algorithm and genetic algorithm

[J]. Journal of Geo-Information Science, 2021, 23(9):1662-1674.

[本文引用: 1]

冯娟, 丁建丽, 魏雯瑜.

基于Albedo-MSAVI特征空间的渭库绿洲土壤盐渍化研究

[J]. 中国农村水利水电, 2018(2):147-152.

[本文引用: 1]

选取新疆塔里木河流域渭库绿洲为研究区,以landsat8 OLI和野外调查为基础数据,分析盐渍化土壤与反照率(Albedo)和修改型土壤调节植被指数(MSAVI)的关系,并提出Albedo-MSAVI特征空间概念,构建监测土壤盐渍化不同指数模型SDI。结果表明:1、Albedo-MSAVI特征空间分布呈现明显的规律性,即地表反照率与修改型土壤调节植被指数在第一象限呈双曲线分布,且盐渍化与非盐渍化土壤分异明显;2、SDI模型与土壤含盐量的决定系数为0.96,能够较好的反应绿洲盐渍化情况;3、不同盐渍化程度的SDI平均差异与非盐渍化SDI平均差异特征明显,其差值在0.12~0.34之间,因此SDI指数可以作为盐渍化信息快速提取的指标,且SDI模型的构建有利于干旱区大尺度定量监测和评价土壤盐渍化工作。

Feng J, Ding J L, Wei W Y.

A study of soil salinization in Weigan and Kuqa Rivers oasis based on Albedo-MSAVI feature space

[J]. China Rural Water and Hydropower, 2018(2):147-152.

[本文引用: 1]

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发