第一作者简介: 柴 颖(1992-),女,硕士研究生,主要从事生态遥感与GIS研究。 Email:elysee115@163.com
光谱特征的选择对于湿地植被的识别精度和效率有直接的影响作用。以美国舍曼(Sherman)岛水域为研究区,基于HyMap航空高光谱遥感影像数据,分析湿地植被的一阶微分光谱和光谱吸收特征,利用逐步判别分析法筛选识别精度较好的光谱特征参数参与C4.5决策树分类。结果表明: 4种湿地植被的一阶导数光谱特征差异较小,吸收特征差异性相对较大; 基于一阶微分光谱特征和光谱吸收特征利用C4.5决策树进行分类,可以实现湿地植被在物种水平上的识别,并达到较好的分类精度。
Certain spectral characteristics have a direct impact on accuracy and efficiency of identifying the wetland vegetation. In this paper, the authors mapped wetland vegetation with 3 m spatial resolution for HyMap image data from Sherman Island of California’s Sacramento-San Joaquin delta. The first-derivative spectral features and spectral absorption features of different species were analyzed by the method of stepwise discriminate analysis, and the spectral characteristic parameters with better classification accuracy were screened to identify species of wetland vegetation in C4.5 decision tree classifier. The results showed that the absorption features of four plants have larger differences than first-derivative spectral features. The results also showed that C4.5 decision tree classifier in combination with the first-derivative spectral characteristics and spectral absorption characteristics could be effective in distinguishing wetland vegetation and allowing for species-level detection.
近年来, 高光谱遥感技术在湿地植被的精细识别和分类方面的应用逐渐增多。由于高光谱遥感数据具有波段多、信息量大、信息冗余等特点, 如何对高光谱数据进行降维处理是国内外学者研究的重点问题之一[1]。Hestir等采用光谱角分类器对美国加州三角洲的入侵水生植物进行了物种识别和分类制图[2]; 邱琳等基于均值置信区间估计原理筛选高光谱特征波段得到光谱差异显著的波段从而进行湿地植物信息的提取[3]; 刘雪华等采用马氏距离和主成分分析法对高光谱数据进行降维, 利用提取的光谱信息构建湿地植物判别模型[4]。然而, 这些学者大多通过分析光谱差异进行湿地植物分类研究, 目前基于高光谱影像利用光谱特征识别湿地植被种类和组成的研究尚未深入展开。
本文以高光谱和高空间分辨率的HyMap航空遥感影像数据为数据源, 基于地面实测数据在影像上提取典型湿地植被的反射光谱, 利用光谱微分法和连续统去除法分析湿地植物的光谱特征, 基于逐步判别分析法筛选识别精度较好的光谱特征参数参与C4.5决策树分类, 使湿地植被达到物种水平上的识别。研究结果可为深入进行湿地资源调查和湿地变化检测等提供科学依据。
萨克拉门托-圣华金三角洲(Sacramento-San Joaquin Delta)位于美国加利福尼亚州西北部萨克拉门托河(Sacramento River)与圣华金河(San Joaquin River)的交汇处。2条河流经旧金山湾流入太平洋。三角洲流域面积为4.5万km2, 是加州的淡水输送系统的主要枢纽[5]。三角洲的水力学异质性体现在该处水体的盐度、潮汐通量、水深的多变以及淡水流量极端的季节与年际变化[5]。一般时候淡水均从各支流顺流流入萨克拉门托-圣华金两河, 再流入海湾; 而涨潮时咸水可倒流入至三角洲的上游部位。三角洲淡水流量有明显的季节性变化特征: 冬季的平均流量约1 700 m3/s, 夏季平均流量则约为540 m3/s[6]。
本文选取沉水植被巴西水草、浮水植被水葫芦、挺水植被蒲草及岸栖植被辣椒水草4种研究区比较典型的植物群落作为研究对象。
研究区域的高光谱遥感数据来源于成像光谱仪HyMap的航摄影像, 航摄时间为2007年6月19— 21日, 航高1 500 m, 空间分辨率3 m。
HyMap是澳大利亚HyVista公司研制的航空成像光谱仪, 共126个波段, 光谱分辨率由12~16 nm不等, 波段范围为0.450~2.543 μ m。
飞行路线贯穿整个三角洲, 共64条航带。本文研究区为第42, 43和44航带上的舍曼(Sherman)岛水域(图1)。
本文野外实测样点的点位数据均利用GPS获得, 平面精度约1 m。实测时记录了样点植被的种类、盖度和位置等属性。每个样点都拍摄2张照片, 一张为样本整体景观, 另一张为近距离单个植株。每张照片都与相应的点位、拍摄时间建立了关联, 方便后续参考和计算。
HyMap数据已由HyVista公司进行了几何纠正和大气校正。本文仅对11个位于大气水汽吸收带的波段和1个数据错误波段进行了剔除; 然后在B29(R)B15(G)B8(B)假彩色合成图像基础上数字化提取水域边界。
2.2.1 光谱导数计算
光谱微分法能够将原始光谱曲线的变化趋势和曲率等特征进行放大, 进而确定光谱曲线的变化区域。一阶导数光谱能反映出植物中叶绿素等物质吸收产生的波形变化, 并揭示光谱峰值特征[7]。因此, 将一阶光谱微分法应用于本次湿地植被的研究, 以期能够获取湿地植被识别的最佳波段。
一阶微分光谱的计算方法为[8]
ρ '(λ i)=[ρ (λ i+1)-ρ (λ i-1)]/2Δ λ , (1)
式中: λ i为波段i的波长; ρ '(λ i)为波长λ i的一阶微分光谱; Δ λ 为波长λ i-1到λ i的间隔, 视波段波长而定。
2.2.2 光谱吸收特征提取
地物光谱曲线反映了地物的吸收和反射特征。湿地植被在可见光和近红外光谱范围内, 由于受叶绿素和水体吸收作用的影响存在着精细的光谱吸收特征, 可以通过定义光谱吸收特征参数来定量描述。因此, 从光谱曲线中提取的光谱吸收特征参数可以用来对湿地植被进行识别和分类。主要的光谱吸收特征量化参数有5种[8], 如下所示。
1)吸收深度(H)。归一化值为1的曲线和吸收谷的最小值之间的垂直距离。
2)吸收面积(A)。归一化值为1 的曲线与吸收谷之间的面积。
3)吸收对称度(S)。 其公式为
S=AL/A , (2)
式中: AL为吸收谷左半端的面积; A为吸收谷整体面积。
4)吸收斜率(K)。其公式为
K=(Re-Rs)/(λ e-λ s) , (3)
式中: λ s, Rs分别为吸收谷起始点和对应反射率; λ e, Re分别为吸收谷终点和对应反射率。
5)光谱吸收指数(SAI)。其公式为
SAI=
式中吸收对称性参数d可表达为
d=(λ e-λ p)/(λ e-λ s) , (5)
其中λ p和Rp分别为吸收点p的波长位置和对应反射率。
通过逐步判别分析可以对湿地植物识别具有最大判别能力的光谱特征参数筛选出来[9]。本文基于SPSS软件进行逐步判别分析。
1993年Quinlan提出C4.5算法, 该算法改进了ID3算法, 用信息增益率取代了ID3算法中的信息增益来选择决策树的测试属性。信息增益率为
R=G/S , (6)
式中: 信息增益率R为信息增益G与分割信息量S的比值。C4.5算法选取信息增益率最大的测试属性值作为节点, 生成决策树[10]。
根据GPS采样数据的属性信息, 选取单种植被盖度为80%~100%的629个实测点为样本点, 其中训练样本点370个, 验证点259个, 如表1所示。根据训练样本在影像上提取光谱曲线, 由于波长大于1.343 6 μ m(中红外)的波段受水体的影响较大, 因此仅对0.452~1.343 6 μ m波段进行分析。
![]() | 表1 研究区地物类别样本情况 Tab.1 Samples of different wetland vegetation types in the study area |
从图2(a)可以看出, 4种湿地植物的光谱曲线都呈现出典型绿色植物特有的光谱特征。不同水分梯度下的湿地植物由于水体背景噪声的影响, 光谱特征(特别是在近红外波段)有着明显的差距。
4种植被的一阶微分光谱曲线如图2(b)所示。不同植被在0.52 μ m, 0.73 μ m和1.01 μ m附近有3个较明显的反射率增速极值; 在0.94 μ m, 1.13 μ m和1.30 μ m分别达到反射率减速最快的极点, 且在这些极值点上的光谱值差异较大。因此, 本文选择差异比较明显的波段0.511~0.526 6 μ m, 0.694 6~0.74 μ m, 0.929 9~0.945 5 μ m, 0.992 9~1.024 2 μ m, 1.115 5~1.159 5 μ m, 1.288 2~1.330 2 μ m共17个光谱值用于物种识别研究。
分析研究区典型湿地植被光谱曲线, 发现不同种类湿地植物由于含水量、叶绿素含量和细胞结构的差异, 在0.452~0.542 μ m, 0.572 3~0.74 μ m, 0.929 9~1.070 3 μ m和1.115 5~1.260 2 μ m波段存在4个差异明显的吸收谷。因此采用连续统去除法[11]对这4个吸收波段进行归一化处理(图2(c)), 进而深入分析植被光谱的吸收特征。
根据原始光谱计算斜率(K)和光谱吸收指数(SAI), 对光谱连续统去除后的吸收深度做进一步计算, 得到各吸收波段的吸收深度(H)、吸收谷面积(A)和对称度(S)。湿地植物在4个吸收谷的特征参数表现不同, 有的差异明显, 有的变化则比较稳定(表2)。巴西水草由于沉入水中, 在第3, 4吸收波段的吸收谷最大; 而辣椒水草在第1, 2, 4波段的吸收谷最小。这些特征可通过吸收深度(H)和吸收谷面积(A)等来定量描述。4种植物在绿光和近红外区间的反射峰值存在差异, 可通过斜率(K)和光谱吸收指数(SAI)使光谱特征信息差距加以突出。
![]() | 表2 不同湿地植被在4个吸收谷处的吸收特征分析 Tab.2 Spectral absorption characteristic parameters of different wetland vegetation in 4 adsorption valleys |
由于提取的参数众多, 特征重叠, 所以在建模之前需进行参数选择, 对一阶微分的17个波段和20个光谱吸收特征参数进行了逐步判别分析。其中求解过程中, 逐步选择变量的方式采用马氏距离, 判别函数系数选择Fisher判别方程的系数。最终判别结果如表3所示。
![]() | 表3 不同变化方法的植被识别精度及入选特征 Tab.3 Discriminated accuracies and selected characteristics with different methods |
利用上述方法, 得到的分类结果见图3。
从图3可知, 蒲草和辣椒水草主要分布于浅滩上, 石莲花(属其他植被类)主要分布在水域中流速较缓的区域, 巴西水草则分布在离岸有一定距离, 河水有一定深度的区域。
对照样点的实测资料, 对分类结果进行精度评价, 生成的混淆矩阵如表4所示。分类总精度达到84.17%, Kappa系数达到0.801 7, 表明本文的分类结果具有较高的精度。
![]() | 表4 典型湿地植被分类结果精度 Tab.4 Classification accuracy of typical wetland vegetation |
本文基于HyMap高光谱航空遥感数据提取湿地植物光谱曲线, 定量分析不同种类湿地植物的光谱特征, 进行湿地植物种类识别研究, 取得的主要结论如下:
1)研究发现, 4种湿地植被由于叶绿素含量和细胞结构的差异, 在0.452~0.542 μ m, 0.572 3~0.74 μ m, 0.929 9~1.070 3 μ m和1.115 5~1.260 2 μ m波段存在4个差异明显的吸收谷, 可以通过固定的吸收波段来分析不同植物光谱的吸收特征。
2)通过对一阶微分光谱和光谱吸收特征参数进行逐步判别分析可知, 4种湿地植被的一阶导数光谱特征差异较小, 吸收特征差异性相对较大。这是因为湿地植物特殊的生存环境, 光谱反射率受背景水体的影响较大, 由于受水体吸收作用的影响, 其光谱吸收特征的识别效果更好。
3)基于一阶导数光谱特征和光谱吸收特征, 采用C4.5决策树分类法可以使湿地植物的识别达到物种水平上, 获得较好的分类精度。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|