基于PLSR的陕北土壤盐分高光谱反演
李晓明1,2, 王曙光1,2, 韩霁昌1,2
1.陕西省土地工程建设集团,西安 710075
2.国土资源部退化及未利用土地整治工程重点实验室,西安 710075
韩霁昌(1966-),男,博士,研究员,从事土地工程方面研究。Email:jchansn@126.com

第一作者简介: 李晓明(1983-),男,博士,从事土地资源利用与遥感信息方面研究。Email:xmlisdc@126.com

摘要

选取陕北盐渍土为研究对象,通过采集高光谱数据及土壤样品测定,研究土壤盐分含量与反射率之间相关性,遴选盐分特征波段,利用常规回归分析及偏最小二乘回归分析建立土壤盐分的定量反演模型,并利用检验样点进行对比分析和精度检验。研究结果表明,482 nm,1 365 nm,1 384 nm,2 202 nm及2 353 nm为土壤盐分含量的特征波段,利用高光谱数据进行盐分定量反演具有良好的精度; 精度检验结果表明,通过Matlab进行偏最小二乘回归计算的反演模型,实测值与预测值相关性更好,精度较高。

关键词: 偏最小二乘回归(PLSR); 土壤盐分; 高光谱反演
中图分类号:S156.4TP79 文献标志码:A 文章编号:1001-070X(2014)03-0113-04 doi: 10.6046/gtzyyg.2014.03.18
Hyperspectral remote sensing inversion of soil salinity in north Shaanxi based on PLSR
LI Xiaoming1,2, WANG Shuguang1,2, HAN Jichang1,2
1. Shaanxi Land Engineering Construction Group, Xi’an 710075, China
2. Key Laboratory of Degraded and Unused Land Consolidation Engineering, Ministry of Land and Resources of China, Xi’an 710075, China
Abstract

The salinized soil in northern Shaanxi Province was chosen as the study object. The hyperspectral data were collected and the soil samples were analyzed. First, the correlation between the soil salinity and the reflectance were analyzed, and the characteristic bands were fitted. The usual regression and partial least squares regression (PLSR) analysis was used to study the inversion model of soil salinity, and some testing samples were used to compare the accuracies. The results show that 482 nm, 1 365 nm, 1 384 nm, 2 202 nm and 2 353 nm are five characteristic wavelengths, and the precision of inversion is satisfactory. The result of precision test indicates that the inversion model with PLSR calculated by Matlab is fairly good, and the correlation between the measured value and the predicted value is better.

Keyword: partial least squares regression (PLSR); soil salinity; hyperspectral inversion
0 引言

盐渍化是我国土壤退化主要类型之一, 严重制约了粮食生产和农业发展。我国盐渍土分布总面积约为3 600 × 104 hm2, 占全国可利用土地面积的4.88%[1], 其中, 陕西、甘肃、宁夏、青海、内蒙、新疆西部6省区盐碱地面积占全国的69.03%[2], 陕西省盐渍化土约有21× 104 hm2, 主要分布在陕北和关中东部。盐渍土改良治理是保障国家耕地面积和粮食安全的重要举措。传统的盐渍化监测主要通过田间采样和实验分析进行, 这种方法费时、费力。高光谱数据凭借其高光谱分辨率, 能够反映地物光谱的细微特征, 使得依据光谱特征来进行土壤性质的定量反演成为可能[3]

随着遥感技术的发展, 国内外利用高光谱技术研究土壤性质有了一定进展[4]。Dehaan R L[5]等利用土壤及相关植被的光谱特征研究土壤的盐渍化特征及其空间分布; Farifteh J[6, 7]等利用偏最小二乘回归(partial least squares regression, PLSR)和人工神经网络2种方法对盐渍土光谱特征进行定量分析; 丁建丽[3]等利用土壤、植被高光谱指数, 研究盐渍化程度的敏感波段; 刘焕军[8]等通过建立各种土壤光谱指数, 分析并确定反映盐碱化程度的最佳波段与土壤光谱指数; 吴代晖[9]、宋韬[10]等研究了土壤含水量与土壤反射率关系, 对利用高光谱数据实现土壤水分的快速测定进行探讨研究; 鲍一丹[11]、易时来[12]等利用近红外光谱特征对土壤养分含量进行估算研究。

本文通过对陕北盐渍土进行高光谱测定, 遴选特征波段, 并建立定量反演模型, 这对于实现土壤盐渍化监测, 指导当地盐碱地整治改良工作具有实用意义。

1 研究区概况与研究方法
1.1 研究区概况

以陕北省定边市为研究区, 该区位于毛乌素沙地南缘, 是黄土高原与内蒙古鄂尔多斯荒漠草原过渡地带。该区域属于温带大陆性半干旱季风气候, 春季多风, 夏季干旱, 秋季阴雨, 冬季严寒, 日照充足, 年均气温7.9 ℃, 年均降水量316.9 mm。研究区内地势宽广平坦, 地下水位高, 土壤盐碱化严重。

1.2 数据获取

在研究区内随机布设70个样点, 其中42个用于建立土壤盐分反演模型, 其余28个用于精度检验。利用美国ASD公司生产的FieldSpec 4 HR型地物光谱仪(光谱范围为350~2 500 nm)测定样点的高光谱数据, 每个样点重复采集10条光谱曲线; 同时采集各个样点的土壤表层样品; 样品带回实验室经自然风干、磨细过筛等处理, 测定土样的盐分含量, 测定方法参照《土壤农业化学分析方法》[13]

1.3 研究方法

本文中高光谱数据的处理在ASD公司的ViewSpecPro软件中进行, 首先加载显示样点的光谱曲线(10条), 判断并剔除离群异常值, 然后取剩余曲线的算术平均值作为该样点的高光谱特征值。偏最小二乘回归建立在一般最小二乘回归的基础上, 能够解决自变量存在严重多重相关性和样本点个数少于变量个数的条件下的回归建模问题。该方法不再直接考虑因变量与自变量的回归建模, 而是对变量系统中的信息重新进行综合筛选, 从中选取若干对系统具有最佳解释能力的新成分用于回归建模。经过这样的信息筛选, 排除了对因变量无解释作用的噪声, 因此PLSR模型的计算结果更为可靠[14]。本文研究中引入PLSR分析进行土壤盐分定量反演, 计算过程通过Matlab编程实现。

本研究首先通过研究获取各样点反射率, 分析其与土壤盐分含量的相关性, 遴选相关性较好的波段, 用于土壤盐分含量的量化反演, 再分别利用逐步回归分析、强行进入回归分析和偏最小二乘回归分析方法建立土壤盐分的定量反演模型, 并利用检验样点进行比较分析和精度检验。

2 结果与分析
2.1 土壤盐分含量与光谱特征相关性分析

各样点的高光谱数据经过异常值剔除和算术平均等预处理后, 350~2 500 nm波长区间的反射率如图1所示。

图1 部分样点在波长350~2 500 nm区间的土壤反射率Fig.1 Soil reflectance in wavelength from 350 nm to 2 500 nm in some samples

分析土壤盐分含量与不同波长反射率的相关性, 图2显示了随着波长增加的相关系数的变化曲线。

图2 不同波长反射率与盐分含量的相关性Fig.2 Correlations between soil salinity and soil reflectance

对比分析图1图2可以看出, 随着波长的增大, 反射率整体呈现增大趋势, 而相关系数整体呈现降低趋势, 二者具有负相关性, 反射率较低的波段, 盐分含量与反射率的相关系数较高。由相关系数曲线还可以看出, 盐分含量与光谱反射率之间在350~550 nm之间具有良好相关性, 随着波长增加, 相关系数整体呈减小趋势, 但在1 350~1 450 nm及2 150~2 450 nm之间相关系数有明显的先增加后减小的趋势, 呈现明显的波峰; 在1 750~2 000 nm波长范围内, 虽然相关系数有明显变化, 但由于此波长范围主要为水汽吸收带, 对水比较敏感[15], 曲线跳跃厉害, 不易用作土壤盐分含量信息的解译。

2.2 土壤盐分含量定量反演

根据相关性分析结果, 选择相关系数高的波段用于盐分定量反演, 350~550 nm波长范围相关性较好, 482 nm处相关系数最高(图2); 另一方面, 在反射率曲线(图1)中具有明显波峰的波段是土壤盐分含量的特征波段, 如1 350~1 450 nm及2 150~2 450 nm范围。根据相关系数曲线选择波峰点(系数最高)波段, 即1 365 nm, 1 384 nm, 2 202 nm和2 353 nm, 用于盐分定量反演。

以遴选的482 nm, 1 365 nm, 1 384 nm, 2 202 nm和2 353 nm这5个波段反射率为自变量, 利用42个样点数据, 首先利用常用的强行进入回归分析、逐步回归分析, 对盐分含量进行定量反演, 建立土壤盐分的定量反演模型, 即

TS=2.306+28.926R482+19.407R1 365+0.853R1 384+13.899R2 202-38.948R2 353 (r2=0.885* * ) , (1)

TS=1.361+24.916R482 (r2=0.869* * ) 。 (2)

式中, TS为土壤盐分含量, g/kg; R482, R1 365, R1 384, R2 202R2 353分别为482 nm, 1 365 nm, 1 384 nm及2 202 nm, 2 353 nm波段的反射率, 下同。

由式(1)(2)可以看出, 逐步回归分析在模型建立过程中, 考虑全部自变量对因变量的的作用大小, 按显著程度大小, 由大到小逐个引入回归方程, 在引入新变量前回归方程中只含有对因变量影响显著的变量, 而不显著的变量已被剔除。对比式(1)和式(2)可以看出, 只有482 nm波段的反射率在逐步回归分析中被保留, 其他波段由于对土壤盐分含量的影响不显著而被剔除, 虽然式(1)比式(2)具有更高的决定系数, 但是引入多个因变量之间存在一定的数据冗余。偏最小二乘回归考虑了变量间的相关性, 由此建立的回归模型拟补了常规回归分析的缺点。在Matlab里编程, 计算偏最小二乘回归分析的定量反演模型, 即

TS=2.263 1+27.201 8R482+17.150 5R1 365+5.127 9R1 384-12.529 5R2 202-12.949 4R2 353 。 (3)

2.3 精度检验

利用28个检验样点, 对土壤盐分的定量反演模型进行精度检验。计算实测值与反演值并进行对比, 即

P=1.246M+0.308 1 (r2=0.740, n=28) , (4)

P=1.1372M+0.948 8 (r2=0.700, n=28) , (5)

P=1.222M+0.461 5 (r2=0.742, n=28) 。 (6)

式中: P’ , P″, P分别为基于式(1)(2)(3)计算获取的预测值; M为检验样点实测值。对比计算结果可知, 利用偏最小二乘回归获取的反演模型具有最高的精度。

3 结论与讨论

1)研究结果表明, 土壤盐分含量与其反射率呈现负相关关系, 在350~550 nm波长范围内, 反射率与土壤盐分含量之间具有良好相关性。通过研究分析, 选取482 nm, 1 365 nm, 1 384 nm, 2 202 nm及2 353 nm这5个波段为土壤盐分的特征波段, 用于盐分的定量反演。

2)对比利用常用的回归分析方法与偏最小二乘回归分析方法获取的土壤盐分定量反演模型, 通过精度检验可以发现, 利用偏最小二乘回归获取的反演模型具有较高的精度, 这主要是因为偏最小二乘回归分析法兼具了主成分分析、典型相关分析和多元线性回归分析3种方法的优点, 能够在自变量存在严重多重相关性、样本点个数少于变量个数的条件下进行回归建模, 精度较高。

3)对比检验样点的实测值和预测值可以发现, 利用土壤的反射率对土壤盐分含量进行定量反演, 具有良好精度。在遥感技术飞速发展的今天, 建立的土壤盐分定量反演模型, 进一步应用于遥感影像的解译, 将有助于实现土壤盐渍化的大范围快速监测。

The authors have declared that no competing interests exist.

参考文献
[1] 王遵亲, 祝寿全, 俞仁培, . 中国盐渍土[M]. 北京: 科学出版社, 1993.
Wang Z Q, Zhu S Q, Yu R P, et al. Salinized soils in China[M]. Beijing: Science Press, 1993. [本文引用:1]
[2] 杨劲松. 中国盐渍土研究的发展历程与展望[J]. 土壤学报, 2008, 45(5): 837-845.
Yang J S. Development and prospect of the research on salt-affected soils in China[J]. Acta Pedologica Sinica, 2008, 45(5): 837-845. [本文引用:1] [CJCR: 1.979]
[3] 丁建丽, 伍漫春, 刘海霞, . 基于综合高光谱指数的区域土壤盐渍化监测研究[J]. 光谱学与光谱分析, 2012, 32(7): 1918-1922.
Ding J L, Wu M C, Liu H X, et al. Study on the soil salinization monitoring based on synthetical hyperspectral index[J]. Spectroscopy and Spectral Analysis, 2012, 32(7): 1918-1922. [本文引用:2] [JCR: 0.293] [CJCR: 1.36]
[4] 王静, 何挺, 李玉环. 基于高光谱遥感技术的土地质量信息挖掘研究[J]. 遥感学报, 2005, 9(4): 438-445.
Wang J, He T, Li Y H. Studying on extraction methods for land quality information based on hyperspectral data[J]. Journal of Remote Sensing, 2005, 9(4): 438-445. [本文引用:1] [CJCR: 0.992]
[5] Dehaan R L, Taylor G R. Field-derived spectra of salinized soils and vegetation as indicators of irrigation-induced soil salinization[J]. Remote Sensing of Environment, 2002, 80(3): 406-417. [本文引用:1] [JCR: 5.103]
[6] Farifteh J, Farshad A, George R J. Assessing salt-affected soils using remote sensing, solute modelling, and geophysics[J]. Geoderma, 2006, 130(3-4): 191-206. [本文引用:1] [JCR: 2.345]
[7] Farifteh J, Van der Meer F, Atzberger C, et al. Quantitative analysis of salt-affected soil reflectance spectra: A comparison of two adaptive methods(PLSR and ANN)[J]. Remote Sensing of Environment, 2007, 110(1): 59-78. [本文引用:1] [JCR: 5.103]
[8] 刘焕军, 张柏, 王宗明, . 基于反射光谱特征的土壤盐碱化评价[J]. 红外与毫米波学报, 2008, 27(2): 138-142.
Liu H J, Zhang B, Wang Z M, et al. Soil saline-alkalization evaluation basing on spectral reflectance characteristics[J]. Journal of Infrared and Millimeter Waves, 2008, 27(2): 138-142. [本文引用:1] [JCR: 0.292] [CJCR: 1.14]
[9] 吴代晖, 范闻捷, 崔要奎, . 高光谱遥感监测土壤含水量研究进展[J]. 光谱学与光谱分析, 2010, 30(11): 3067-3071.
Wu D H, Fan W J, Cui Y K, et al. Review of monitoring soil water content using hyperspectral remote sensing[J]. Spectroscopy and Spectral Analysis, 2010, 30(11): 3067-3071. [本文引用:1] [JCR: 0.293] [CJCR: 1.36]
[10] 宋韬, 鲍一丹, 何勇. 利用光谱数据快速检测土壤含水量的方法研究[J]. 光谱学与光谱分析, 2009, 29(3): 675-677.
Song T, Bao Y D, He Y. Research on the method for rapid detection of soil moisture content using spectral data[J]. Spectroscopy and Spectral Analysis, 2009, 29(3): 675-677. [本文引用:1] [JCR: 0.293] [CJCR: 1.36]
[11] 鲍一丹, 何勇, 方慧, . 土壤的光谱特征及氮含量的预测研究[J]. 光谱学与光谱分析, 2007, 27(1): 62-65.
Bao Y D, He Y, Fang H, et al. Spectral characterization and N content prediction of soil with different particle size and moisture content[J]. Spectroscopy and Spectral Analysis, 2007, 27(1): 62-65. [本文引用:1] [JCR: 0.293] [CJCR: 1.36]
[12] 易时来, 邓烈, 何绍兰, . 三峡库区柑桔园紫色土光谱特征及其与氮素相关性研究[J]. 光谱学与光谱分析, 2009, 29(9): 2494-2498.
Yi S L, Deng L, He S L, et al. Study on the correlation of spectral characteristic and nitrogen content of the soil in citrus orchard of Three Gorges Reservoir Area[J]. Spectroscopy and Spectral Analysis, 2009, 29(9): 2494-2498. [本文引用:1] [JCR: 0.293] [CJCR: 1.36]
[13] 鲁如坤. 土壤农业化学分析方法[M]. 北京: 中国农业科技出版社, 2000.
Lu R K. Methods for chemical analysis of soils[M]. Beijing: Chinese Agriculture Science Press, 2000. [本文引用:1]
[14] 翁永玲, 戚浩平, 方洪宾, . 基于PLSR方法的青海茶卡-共和盆地土壤盐分高光谱遥感反演[J]. 土壤学报, 2010, 47(6): 1255-1263.
Weng Y L, Qi H P, Fang H B, et al. PLSR-based hyperspectral remote sensing retrieval of soil salinity of Chaka-Gonghe Basin in Qinghai Province[J]. Acta Pedologica Sinica, 2010, 47(6): 1255-1263. [本文引用:1] [CJCR: 1.979]
[15] 陈祯. 不同土壤含水率、体积质量及光谱反射率的关系模型[J]. 农业工程学报, 2012, 28(4): 76-81.
Chen Z. Relationship model among water content, bulk density and reflectivity of different soil[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(4): 76-81. [本文引用:1] [CJCR: 1.299]