第一作者简介: 周亚敏(1989-),女,硕士研究生,主要研究方向为地理信息技术与遥感应用。Email:591283291@qq.com。
高光谱遥感数据能够提供比多光谱遥感数据更为丰富的光谱信息,从而更精确地刻画地物的光谱特征。在水体遥感原理基础上,采用自适应波段选择(adaptive band selection,ABS)方法对HJ-1A卫星高光谱数据的波段相关性和信息量进行分析,结合BP神经网络技术确定最优波段组合并构建盐湖矿物离子含量的反演模型,对柴达木盆地西台吉乃尔湖的K+,Mg2+,Na+,Cl-和S
Hyper-spectral remote sensing data can provide more spectral information and describe the spectral signature of salt lake more accurately than multi-spectral remote sensing data. Based on the theory of remote sensing on water, the authors analyzed the band correlation and information of HJ-1A satellite hyper-spectrum image by using adaptive band selection(ABS) method. Combined with BP neural network techniques, the authors determined the optimal band combination, established the retrieval models for mineral ions salinity of salt lake, quantitatively determined the salinities of K+, Mg2+, Na+, Cl-, S
近年来, 国内外研究学者对盐湖矿物离子含量的监测进行了大量研究。传统方法采用实地采样和实验室分析等手段[1, 2, 3, 4], 在精度上虽有较高的准确性, 但受制于在局部点上进行, 不能全面反映盐湖矿物离子含量的分布情况, 且费时、费力、成本高。随着遥感技术的快速发展, 应用遥感方法研究盐湖受到越来越多的关注[5]。遥感具有宏观、动态、实时等优点。 目前, 对盐湖的遥感研究大多基于多光谱数据, 采用统计方法, 依据经验模型获得水体总含盐量和水深等信息[6, 7, 8, 9, 10, 11, 12, 13, 14]。但由于盐湖卤水中盐分矿物组成之间对光谱反射相互影响, 复杂成分卤水中单一离子含量的实测光谱反射特征很难在多光谱数据中找到相对应的波段; 因此, 利用多光谱数据对单一离子含量的定量反演存在一定难度。高光谱遥感利用许多狭窄的电磁波波段能够捕捉到盐湖复杂的光谱特征, 使得本来在宽波段遥感中不可探测的物质可以被探测到[15]。因此, 采用高光谱数据能够精确地描述盐湖的光谱特征, 为监测盐湖离子含量提供前提条件。因盐湖矿物离子含量与光谱反射率之间是一种复杂的非线性关系[16], 故利用传统的线性回归模型进行盐湖矿物离子含量反演的精度较低。BP神经网络模型由于其具备映射复杂关系的能力, 非常适用于光学特征复杂的水体参数的提取[17]; 因此, 对盐湖矿物离子含量可采用BP神经网络模型进行模拟。
本文利用HJ-1A卫星高光谱成像仪(hyper spectral imager, HSI)数据2级产品(以下简称HJ-1A高光谱数据)对柴达木盆地西台吉乃尔湖的K+, Mg2+, Na+, Cl-和S
西台吉乃尔湖位于青海省柴达木盆地中部, 地理位置介于E93° 16'~93° 29', N37° 39'~37° 47'之间。北近邻315国道上的一里坪, 南离格尔木市的乌图美仁90 km, 东距东台吉乃尔湖35 km, 西距海西州茫崖镇约130 km。盐湖湖盆呈近似三角形, 为封闭的内流盆地, 固、液相并存; 液相卤水资源包括湖表卤水和晶间卤水, 水化学类型为硫酸镁亚型, 富含K, B, Li等元素, 有较好的开发应用前景。湖表卤水矿化度336.3 g/L, 相对密度1.225 5, pH值7.7; 晶间卤水矿化度334.6 g/L, 相对密度1.223 3, pH值7.9。西台吉乃尔盐湖固体盐类矿物由石盐、芒硝、石膏和白纳镁矾等组成, 以石盐为主[18] 。
2013年5月8— 10日, 天气晴朗, 能见度高, 在西台吉乃尔湖通过GPS布点, 采集包括湖表液体样本和盐滩固体样本。采样点共21个, 其中盐滩固体采样点15个、湖表液体采样点6个。固体样本用自封袋封装, 液体样本用塑料瓶封装, 并贴上标签, 记录其经纬度坐标和采样点号。在实验室采用光谱分析仪测得采样点主要矿物离子K+, Mg2+, Na+, Cl-和S
实验采用与样本采集同期获取的1景HJ-1A高光谱图像数据, 空间分辨率为100 m, 平均光谱分辨率为4.32 nm; 共有115个波段, 分布在可见光和近红外谱段(450~950 nm)内; 图像大小为589像元× 639像元, 覆盖了整个西台吉乃尔湖, 无明显的云盖, 光谱信息丰富, 没有局部几何失真和变形。
HJ-1A高光谱数据的2级产品采用HDF5格式, 需格式转换为ENVI可读文件; 经辐射校正后得到绝对辐射亮度值图像。由于部分波段的图像存在严重的条带噪声, 图像质量较低, 会影响高光谱图像的应用效果; 为此, 本文参考高海亮等[19]提出的基于参考波段的移动窗口条带去噪方法, 有效地去除了图像的条带噪声, 显著地提高了图像的清晰度, 并保留了原始影像的基本信息。然后利用FLAASH大气校正模型对高光谱辐亮度图像进行大气校正, 最终获得115个波段的地表反射率图像。实验采用的HJ-1A高光谱数据的2级产品已经过系统校正, 为便于在图像中对采样点精确定位, 使用Landsat8图像作为标准图像对HJ-1A图像进行几何精纠正。为避免光谱信息丢失, 图像重采样采用最邻近点法, 选择UTM投影, WGS84坐标系, 控制点力求均匀分布, 总误差在0.5个像元之内。
HJ-1A高光谱数据的光谱分辨率很高, 能探测到地物光谱特性的微小差异, 为地物的精确监测提供了前提条件。但因光谱维度较高, 数据信息冗余大, 波段相关性强, 会对高光谱数据的处理带来困难; 因此, 实现高光谱数据的降维对数据的后续处理具有重要意义[20] 。通过数据降维, 一方面能降低影像噪声的影响, 另一方面能减小数据的冗余, 提高图像处理的效率。本文参考刘春红等[21]提出的自适应波段选择(adaptive band selection, ABS)方法进行波段选择。这种降维方法着重分析波段之间的空间相关性和谱间相关性, 通过构造的数学模型获得每个波段的ABS指数, ABS指数越大表明该波段信息量越大且与其他波段相关性越小。将ABS指数由大到小排列, 根据实际应用需求选取排在前面的n个波段。ABS方法基于以下原则: ①选取的波段组合信息量丰富; ②选取波段之间相关性小。
构造的数学模型为
Ii=
σ i=
Ri, j(x, y)=
式(1)— (3)中: Ii为第i个波段的ABS指数; σ i为第i个波段DN值的标准差; Ri-1, i和Ri, i+1分别为第i个波段与其前后2个波段的相关系数, 数值越小表明2个波段的独立性越高; M和N分别为图像的行、列像元数; fi(x, y)为第i个波段中第x行第y列像元的DN值;
用ABS方法获得的指数充分考虑了每个波段的信息富集程度以及与相邻波段的相似性, Ii越大, 相应图像的信息量越大, 越具代表性[21] 。
BP神经网络技术是模拟人脑的神经网络行为特征而建立的分布式并行信息处理算法的数学模型。该模型采用了反向传播(back propagation, BP)算法训练, 其基本思想是: 如果利用已有权重和阈值正向传播得不到期望的输出, 则反向传播; 反复修改(迭代)各节点的权重和阈值, 逐步减小代价函数, 直至达到预先设定的要求。一般以代价函数小于某一相当小的正数, 或迭代不再减小而使反复振荡停止时, 完成BP网络的训练及输入与输出之间映射关系的确定。简言之, 就是不断调整权值, 使网络总误差最小[22]。
本文将降维处理后的波段组合光谱反射率作为模型的输入层; 输出层为1个节点, 对应矿物离子含量。隐含层节点数根据经验公式确定, 即
n=
式中: n为隐含层节点数; ni为输入节点数; n0为输出节点数; a为1~10之间的常数。
通过不断训练, 选取训练效果较好的传递函数和训练函数[23] 。
由于样本是小样本数据, 本文采用循环精度检验的方法进行精度验证。其原理是: 抽取任一样本作为检验值, 将剩余样本输入模型进行训练, 利用训练好的模型获得抽取样本的预测值; 循环以上步骤, 即可得到所有样本的预测值。循环精度检验的前提是假设训练样本数据的好坏程度基本一致, 使得每次检验得出的模型可以大致认为是相同的[22] 。
此外, 本文还选择以下2个指标来评价监测模型的预测效果。
1)决定系数(R2)。该指标反映用预测值解释实测值变化的程度, R2越大, 模型越稳定。其计算公式为
R2=
式中: i为采样点号;
2)相对误差(RE)。该指标反映预测的可信程度, 是一个无量纲的值, RE越小, 模型预测精度越高。其计算公式为
RE=
本文采用的BP神经网络由Matlab的Neural Network Toolbox提供, 共有3层, 即输入层、隐含层和输出层。
选取采样点对应的ABS指数排在前n个波段组合的光谱反射率作为输入层, 节点数即为n。本文分别将n设为20, 15, 10和5, 用以检验何种波段组合会使得模型精度和效率最优。分别将采样点对应的K+, Mg2+, Na+, Cl-和S
训练函数为trainlm( Levenberg-Marquardt BP训练函数), 对中等规模的BP神经网络有最快的收敛速度。网络的学习函数为learngdm(梯度下降动量学习函数), 用于计算权值或阈值的变化率。网络的性能函数采用mse(均方误差性能函数), 是衡量“ 平均误差” 较快捷的方法。由于输入数据与输出数据量纲不同, 所以首先要用premnmx函数对样本数据做归一化处理, 训练完毕后再用postmnmx函数做反归一化处理。
以预测Na+离子含量的BP神经网络为例, 不同波段组合构建的BP神经网络模型的训练速度与精度如表2所示。
从表2可以看出, 选取ABS指数排在前20, 15, 10的波段组合训练的BP神经网络模拟结果精度都很高, 但运算效率随波段组合数的减少而降低。波段组合数为5时, 模拟结果精度较低且运算效率显著下降。因此, 本文选择ABS指数排在前20位的波段组合作为BP神经网络输入层, 神经网络拓扑结构为20-5-1, 即20个输入层节点、5个隐含层节点、1个输出层节点。
本文构建的BP神经网络模型中的各个参数和传递函数、训练函数等是经过多次试验比较而得出的较优结果。
在循环精度检验中, 先对所得的神经网络模型进行初始化; 选出20个样本输入该神经网络模型进行训练, 调整权值, 用剩余的一个样本来检验该模型误差, 若|y* -y|/y小于既定误差(y* 是预测值, y是实测值), 则将此结果计为“ 1” , 否则结果记为“ 0” ;
继续选出20个样本(不能与前次重复)输入该神经网络模型进行训练, 再用剩余的1个样本检验该模型误差; ……; 循环进行上述步骤, 直至所有样本全部检验完毕。将检验结果相加、除以总样本数所得百分比就是该模型的精度。既定误差设为5%。由于训练样本数据的好坏程度大致相同, 因此可以认为每次检验得到的模型大致相同。检验结果表明Na+ , Cl-, K+, Mg2+和S
表3为与Na+, Mg2+, Cl-, K+和S
图2为Na+, Cl-, Mg2+, S
由于盐湖与盐滩采样点的矿物离子含量差别很大, 因此对盐湖和盐滩的样本分别展示对应矿物离子含量实测与预测结果。从图2可以看出, 模型的验证精度均为0.999 9, 表明BP神经网络可以很好地反演盐湖矿物离子含量。
图3为盐湖矿物Na+, Mg2+, Cl-, K+和S
从图3可以看出, 高含量的Na+离子主要分布在西台吉乃尔湖南部, 推测这种分布特征可能是受到南部漫流区卤水补给的影响; 在盐湖边缘的Na+离子含量也较高, 为长期蒸发、沉积造成的结果。Cl-离子的高含量分布区域与Na+离子的相同。Mg2+, K+和S
1)传统的盐湖矿物资源监测采用已有资料研究和实地调查、实验室分析等方法不仅时效性差、费时、费力, 而且不能全面反映整个盐湖矿物资源分布情况。本文采用高光谱遥感数据实现了全面、实时、准确地监测盐湖的矿物离子含量, 为盐湖矿物资源监测提供了一种新方法。
2)HJ-1A卫星高光谱数据比多光谱数据具有更高的光谱分辨率, 能探测到地物在光谱特性上更微小的差异, 这为精确反演盐湖矿物离子含量提供了前提条件。但庞大的数据量和波段之间复杂的相关性使高光谱数据处理存在一定困难。本文采用自适应波段选择(ABS)的降维方法, 并通过对比分析选择出最优波段组合构成新的高光谱图像空间, 在不损失重要信息的情况下, 大大降低了计算量, 减少了噪声干扰, 提高了矿物离子含量反演的效率。
3)水体各项水质组分与光谱之间的相互影响是一种非常复杂的非线性关系, 适合用神经网络这样的黑箱模型来模拟。本文采用BP神经网络很好地模拟了盐湖矿物离子含量与光谱反射率之间的关系, 构建的模型精度较高, 且模型稳定性高, 反演结果符合实地调查情况。因此, 应用BP神经网络模型能够有效地反演盐湖矿物离子含量。
4)经研究、分析和对比, 发现西台吉乃尔湖近几年盐湖面积和矿物离子含量分布情况发生了较大变化。气候变化的影响与人工对地表径流的干扰使得盐湖长期处于卤水供给不足的环境下, 西台吉乃尔湖已显现明显的退化趋势。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|