基于机载PHI高光谱数据的森林优势树种分类研究
樊雪, 刘清旺, 谭炳香
中国林业科学研究院资源信息研究所,北京 100091
通讯作者: 刘清旺(1978- ),男,助理研究员,主要从事林业遥感等方面研究。Email:liuqw@caf.ac.cn

第一作者: 樊 雪(1990-),女,硕士研究生,主要从事林业高光谱遥感方面研究。Email:fanxue0411@163.com

摘要

近年来,高光谱遥感在林业方面的应用越来越广泛,尤其在分类方面居多。但机载PHI高光谱数据通常用于农业病虫害监测、海洋悬浮物颗粒监测等,在林业方面的应用较少。以湖北省荆门市东宝区为研究区,以机载PHI高光谱遥感数据为数据源,对森林优势树种进行了分类研究。首先采用独立成分分析法(independent component analysis,ICA)对裁剪后的PHI数据进行降噪,并利用自适应波段选择法(adaptive band selection,ABS)进行降维,再采用归一化植被指数(normalized difference vegetation index,NDVI)区分林地与非林地,最后利用支持向量机法(support vector machine,SVM)进行森林优势树种监督分类。研究结果表明,分类精度可达80.70%,Kappa系数达到0.75; 分块处理PHI数据以及采用NDVI区分林地与非林地,对于减弱“同物异谱”和“异物同谱”现象有较好的作用; ABS与SVM相结合的分类方法,较适用于PHI数据在树种识别方面的应用探索,具有重要意义。

关键词: 高光谱数据; PHI; 降维; 波段选择法; SVM
文献标志码:A 文章编号:1001-070X(2017)02-0110-07 doi: 10.6046/gtzyyg.2017.02.16
Classification of forest species using airborne PHI hyperspectral data
FAN Xue, LIU Qingwang, TAN Bingxiang
Research Institute of Forest Resource Information Technique, Chinese Academy of Forestry, Beijing 100091, China
Abstract

Hyperspectral data are becoming more and more widely used in forestry, especially in terms of classification. Nevertheless, the application of PHI in forestry is much less than that in such fields as agricultural pest and disease monitoring and marine suspended particles monitoring. PHI is used in this paper, and the study area is Jingmen in Hubei Province. This paper proposes an independent component analysis (ICA) combined with adaptive band selection (ABS) algorithm to reduce dimensions, extract forest land and non-forest land using (normalized difference vegetation index,NDVI) based on the subset images, and finally classify the images by support vector machine (SVM), with the overall classification accuracy being 80.70%, and Kappa coefficient reaching 0.75. The results show that the chunk of PHI data and the use of the extraction of NDVI to distinguish between forest land and non-forest land to decrease the effect of “the same object with different spectra” and “the same spectrum with different objects” can yield a good effect. It is shown that the combination of ICA - ABS and SVM is suitable for PHI data. This study has an important significance for the application of hyperspectral in tree species recognition.

Keyword: hyperspectral data; PHI; dimensionality reduction; band selection method; SVM
0 引言

高光谱遥感具有光谱分辨率高、波段范围窄、图谱合一、连续成像等特点, 能够区分出地物光谱的细微差别, 探测到其他宽波段遥感无法探测的信息。因此, 高光谱遥感在生态、大气和海洋等诸多应用领域具有很大优势。近年来, 高光谱遥感在林业方面的一个重要应用是对森林树种类型进行识别。森林树种类型识别的主要目的是提取树种的专题信息, 为划分森林类型、绘制林相图和清查森林资源提供基础和依据[1]。目前, 国内外利用高光谱遥感进行树种识别主要是从叶片、冠层和高光谱影像3个研究尺度开展。基于叶片的树种识别主要是对叶片反射率及其变换形式运用统计方法、遗传算法等进行分析, 以树种识别的可行性分析与识别潜力为主要研究内容; 基于冠层的树种识别主要运用光谱信息散度法、光谱角填图法等基于光谱信息的遥感图像分类方法, 并利用地物光谱仪获取的林分冠层反射率曲线, 进行树种分类[2, 3]; 基于高光谱影像的树种识别主要通过对影像进行去噪降维等预处理后, 运用监督或非监督分类的方法进行树种识别。

国外已有很多学者对高光谱树种识别进行了研究。Gong等[4]利用ANN分类法对光谱数据进行判别, 区分出1种阔叶树种和6种针叶树种, 分类精度大于90%; Martin等[5]利用AVIRIS高光谱数据与树种叶片化学成分之间的关系, 鉴别出11种树种类型, 可有效进行树种分类; Petropoulos等[6]分别采用支持向量机和基于对象的分类方法, 对Hyperion高光谱影像进行土地覆盖类型分类, 虽2种分类效果均较好, 但基于对象的分类方法精度更高。国内也有越来越多的学者进行森林树种识别探究。童庆禧等[7]利用光谱波形匹配算法对MAIS高光谱影像进行植被类型识别, 获得了潘阳湖典型湿地的植被分类图, 对高光谱的树种识别提供了实用依据; 王圆圆等[8]采用随机子空间法对OMIS高光谱遥感数据进行识别, 并利用遗传算法来提高分类精度; 刘秀英等[9]使用地物光谱仪测得的光谱数据, 采用逐步判别分析方法、特征波段选择等方法识别出4种树种。综上所述, 国内外利用高光谱数据进行树种识别的研究已取得阶段性的进展, 从研究方法看, 主要基于不同树种具有不同光谱特征的原理, 通过特征波段的合理选择, 或者通过波段变换对高光谱数据进行降维来识别树种。

高光谱影像波段数多, 信息量大, 为地物的精细识别提供优势的同时, 也带来了数据量多, 波段间相关性大, 处理精度和效率下降的问题。本文以湖北省荆门市东宝区为研究区, 利用PHI高光谱数据, 运用自适应波段选择法(adaptive band selection, ABS)与支持向量机法(support vector machine, SVM)相结合的方法, 以及分层分类的策略进行树种识别, 有利于机载PHI高光谱数据分类精度的进一步提高。

1 研究区与数据源
1.1 研究区

研究区位于湖北省荆门市东宝区(图1)。

图1 研究区位置Fig.1 Location of study site

该区地理位置为N30° 58'~N31° 07', E112° 01'~E112° 13', 平均海拔为222 m, 地势西北高东南低, 地形复杂多样, 具有明显的亚热带季风气候, 年平均气温为16.1℃, 年均降水量为949.4 mm。研究区内包含城市住宅区与森林。其中有森林覆盖的地方林木茂密, 树种以马尾松和栓皮栎为主。

1.2 数据源获取

2014年12月4日, 运-5小型多用途飞机搭载PHI航空高光谱测量系统在湖北省荆门市东宝区上空进行数据采集。数据获取当天天气晴朗无(少)云, 航高为700 m, 飞行地速为180 km/h, 航线数目为11条, 航线长度为2 335 m, 总长度为25.685 km。获取的高光谱影像数据具体参数见表1

表1 PHI高光谱影像参数 Tab.1 Parameters of PHI hyperspectral data

高光谱数据假彩色图像见图2, 采用UTM-49带投影。

图2 研究区高光谱影像Fig.2 Hyperspectral image of the study site

实地数据调查时间为2014年12月。调查样地数64个, 调查因子包括样地中心点经纬度、树种类型、树高、胸径、东西冠幅、南北冠幅、郁闭度和叶面积指数等。经调查, 研究区内的优势树种为马尾松、栓皮栎和柏树, 此外, 有少量的广玉兰和杨树等树种类型。样地的主要树种(组)类型见表2

表2 主要树种(组)类型样地数 Tab.2 Main type of tree species (group)
2 数据预处理

获取的PHI数据已经做过辐射定标和几何纠正, 还需要进行影像拼接与裁剪、噪声波段去除、大气校正和数据降噪等预处理。

2.1 噪声波段去除

研究区PHI数据包括117个可见光波段(416~758 nm)和93个近红外波段(761~1 033 nm)。经分析, 416~525 nm和850~1 033 nm 2组数据信息主要为噪声, 因此去除该波段范围的数据。去除噪声波段后, 数据共剩余109个波段, 其中79个可见光波段(528~758 nm), 30个近红外波段(761~847 nm)。

2.2 大气校正

大气校正的目的是消除成像时光照和大气对地物反射率的影响, 反演地物本身的真实反射率, 从而有利于地表特征的提取。本研究中数据条带窄且每条带上成像质量略有不同, 条带间共用同一套校正参数会带来明显的“ 同物异谱” 现象, 因此根据数据的特点, 选用黑暗像元法分别开展大气校正。校正结果见图3。

图3 优势树种大气校正前后光谱曲线Fig.3 Spectral curve of advantage tree species before and after atmospheric correction

2.3 数据降噪

降噪的目的主要是为了突出图像的特征信息, 提高图像的信噪比。本文采用独立成分分析法(independent component analysis, ICA)进行数据降噪。ICA是一种自适应变换域方法, 基于信号的高阶统计量, 研究信号间的独立性。ICA不同于其他方法之处在于, 求得的成分为非高斯分布, 成分之间是统计独立的, 这样不仅可以把独立的噪声数据从影像中去除, 并且可以保持原有图像特征不被改变和破坏。降噪前后的影像及光谱曲线见图4— 图6。

图4 ICA降噪前影像Fig.4 Images before noise reduction by ICA

图5 ICA降噪后影像Fig.5 Images after noise reduction by ICA

图6 ICA降噪前后优势树种光谱曲线Fig.6 Spectral curves of advantage tree species before and after ICA

由图4— 图6可以看出, 降噪后的影像质量明显优于降噪前, 树种的光谱曲线由于滤除了大量噪声信息而更加平滑, 减少了噪声干扰信息。

3 研究方法

本研究技术路线见图7。

图7 技术路线Fig.7 Technical route diagram

3.1 ABS波段选择

ABS是基于最优索引因子组合波段选择法的降维方法。该方法充分考虑了高光谱图像的空间和谱间相关性, 通过计算各个波段的指数, 选择信息量大且与其他波段相关性小的波段; 通过计算波段指数, 选择波段指数比设定阈值大的波段或者选择波段指数排在前n个的所有波段, 从而达到波段降维的目的[10]。ABS依据的原则是尽量选择信息量大且与其他波段相关性小的波段。根据上述原则构造的数学模型为:

Indexi= σi(Ri-1, i+Ri, i+1)2, (1)

σ i= 1M+Nx=1My=1N[fi(x, y)-μi]212, (2)

Ri, j= E[fi(x, y)-μi][fj(x, y)-μj]}E[fi(x, y)-μi]}2E[fj(x, y)-μj]}2, (3)

式中: Indexi是第i个波段的波段指数; Ri-1, iRi, i+1分别是第i个波段与前一个和后一个波段的相关系数; σ i为第i个波段的标准差; E{}为数学期望; MN分别是图像的行、列像元数; fi(x, y)是第i个波段xy列的像元值; μ i是第i个波段的像元平均值。运用该方法, 选择波段指数较大的波段用于后续运算。

3.2 非林地去除

由于研究区除林地外, 还有大量的非林地区域, 有些地物易与各树种混淆, 如栓皮栎与灌草, 杨树与农田等。如果直接基于影像对每一类别逐一选取训练样本分类, 则会大大增加分类工作量, 且仍有一些类别区分度较差。因此, 消除非林地干扰是本研究一个急需解决的重要问题。尽管光谱特征中有些地类容易混淆, 但是利用非林地类别的植被指数(如归一化植被指数(normalized difference vegetation index, NDVI))普遍较低这一信息, 可以很好地将非林地区域与林地区域划分出来。在本研究中, 经过反复试错, 当NDVI< 0.13时, 像元基本为非林地, 将其设为阈值进行林地识别。

3.2.1 落叶阔叶树种的提取

对于落叶阔叶树种, 如栓皮栎类, 其NDVI值很低, 与灌木的NDVI值近似, 若仅利用NDVI阈值判别, 往往直接就被划分为非林地类而无法提取出有效信息。研究发现, 大部分落叶阔叶林NDVI> 0.1, 灌木NDVI< 0.1, 本研究采用如下策略提取栓皮栎类: ①在非林地类中, 对NDVI设置阈值建立掩模图层, 提取主要包含栓皮栎类及少量灌木的b1图层, 判别依据为: 0.1< NDVIb1< 0.2; ②对b1图层选取栓皮栎类训练样本, 以及该图层的其他训练样本; ③单独提取出栓皮栎类, 后处理时加回到林地分类结果中。

3.2.2 林地层树种训练样本选取

结合样地调查数据, 研究区的地物类型主要有常绿树种(马尾松、柏树和广玉兰)、落叶树种(栓皮栎、杨树和构树)、林地阴影和非林地(灌草、农田、道路、房屋和水体等)。除栓皮栎树类外, 其余树种样本均在林地层选取。

3.3 SVM分类

SVM的基本思想是寻找一个分类超平面, 使得训练样本中的2类样本能被分开, 并且距离该平面尽可能地远[11]。SVM具有算法简单、抗噪性强、学习样本小、效率高与推广性好等优点, 能不受传统方法大样本要求的约束, 最终决策函数只由少数的支持向量确定, 可以“ 剔除” 大量冗余样本, 解决高光谱维数灾难问题, 加快运算效率[12]

4 结果与分析
4.1 波段选择

采用ABS最终选择波段指数较大的前36个波段, 其中7个绿光波段(528.4~557.9 nm), 4个黄光波段(560.9~587.5 nm), 6个橙光波段(596.3~617.0 nm), 10个红光波段(622.9~758.8 nm), 9个近红外波段(761.7~794.2 nm)。选择的具体波段见表3

表3 波段指数及其对应的中心波长 Tab.3 Band index and central wavelength
4.2 SVM分类结果

利用机载PHI高光谱数据, 采用ABS对数据进行去噪降维处理, 并运用SVM, 提取训练样本对研究区进行分层分类, 分类结果见图8。

图8 研究区树种组分类结果Fig.8 Classification results of the tree species group in study site

将优势树种马尾松、栓皮栎、柏树以及其他树和非林地分类结果与原始影像对比, 各类别的分布区域和范围比较准确, 说明ABS与SVM分类法结合进行树种识别是可靠的。

选取野外调查的18个马尾松纯林样地、20个栓皮栎纯林样地(除去研究区外的1个纯林样地)、5个柏树纯林样地、2个其他树样地和12个非林地验证样本, 共计57个验证样本, 对分类结果进行精度验证。不同地物分类精度验证结果如表4

表4 分类精度验证 Tab.4 Classification accuracy(%)

比较各树种的分类精度以及错分、漏分误差可以看出, 马尾松和栓皮栎分布比较集中, 光谱曲线比较容易区分, 错分比较少; 而柏树分布较少, 且光谱曲线与未识别的“ 其他树” 类似, 漏分误差比较大, 达到40%, 降低了识别精度; 受地面调查数据的限制, 一些树种的参考样本相对较少或缺失, 如部分研究区内落叶阔叶树种众多。高光谱影像上不同条带上光谱差异较大, 没有样本数据很难确定其树种类型, 难以单独设类, 因此分类后统一归并为其他树类, 这部分数据无法准确地参与精度验证, 一定程度上影响了分类精度的评估。后续研究中可以适当增加树种样本的地面调查数据, 进一步改进分类方法, 提高分类精度。总体而言, 总体分类精度达到80.70%, Kappa系数为0.75, 部分树种精度可达90%以上, 较好地实现了树种识别。

5 结论

本研究基于机载PHI高光谱遥感影像, 通过辐射定标、几何纠正、大气校正、图像裁剪和降噪等预处理, 并采用ABS降维方法对高光谱影像进行数据处理, 对生成的影像, 选用SVM分类方法进行分类, 得出如下结论:

1)该机载高光谱数据共210个波段, 采用ABS进行降维, 获得36个信息量较大的波段, 可以很好地刻画区分各个类别, 实现树种级的识别;

2)采用的分层分类策略能够有效识别常绿、落叶的针叶、阔叶及非林地类别;

3)经实地验证, 各类别范围和分布区域较准确, 总体分类精度达到80.70%, Kappa系数为0.75。

采用分航带的方法进行分类, 虽然可以有效避免错分现象, 提高分类精度, 但是仍然存在一些问题: ①测试的高光谱数据波长范围在416~1 033 nm, 经试验发现416~492 nm和850~1 033 nm波长范围内数据噪声影响较大, 若将该范围内的波段加入到分类特征变量中, 不仅会增大参考样本与影像像元的匹配难度, 还会干扰分类精度, 故本研究分类有效波长仅集中于495~ 850 nm的可见光-近红外波段范围。在后续的研究中, 将利用一些更有效的降噪手段, 提高这些波段的信噪比, 以便增加对分类精度提升有益的待选变量; ②受地面调查数据的限制, 一些树种的参考样本相对较少或缺失, 后续研究中可以适当增加树种样本, 如构树和广玉兰等的地面调查数据, 进一步改进分类方法, 提高分类精度。

The authors have declared that no competing interests exist.

参考文献
[1] 刘旭升, 张晓丽. 森林植被遥感分类研究进展与对策[J]. 林业资源管理, 2004(1): 61-64.
Liu X S, Zhang X L. Research advances and countermeasures of remote sensing classification of forest vegetation[J]. Forest Resources Management, 2004(1): 61-64. [本文引用:1]
[2] Pengra B W, Johnston C A, Loveland T R. Mapping an invasive plant, Phragmites australis, in coastal wetland s using the EO-1 Hyperion hyperspectral sensor[J]. Remote Sensing of Environment, 2007, 108(1): 74-81. [本文引用:1]
[3] Wang C, Menenti M, Stoll M P, et al. Mapping mixed vegetation communities in salt marshes using airborne spectral data[J]. Remote Sensing of Environment, 2007, 107(4): 559-570. [本文引用:1]
[4] Gong P, Pu R L, Yu B. Conifer species recognition: An exploratory analysis of in situ hyperspectral data[J]. Remote Sensing of Environment, 1997, 62(2): 189-200. [本文引用:1]
[5] Martin M E, Newman S D, Aber J D, et al. Determining forest species composition using high spectral resolution remote sensing data[J]. Remote Sensing of Environment, 1998, 65(3): 249-254. [本文引用:1]
[6] Petropoulos G P, Kalaitzidis C, Vadrevu K P. Support vector machines and object-based classification for obtaining land -use/cover cartography from Hyperion hyperspectral imagery[J]. Computers and Geosciences, 2012, 41: 99-107. [本文引用:1]
[7] 童庆禧, 郑兰芬, 王晋年, . 湿地植被成象光谱遥感研究[J]. 遥感学报, 1997, 1(1): 50-57.
Tong Q X, Zheng L F, Wang J N, et al. Study on imaging spectrometer remote sensing information for wetland vegetation[J]. Journal of Remote Sensing, 1997, 1(1): 50-57. [本文引用:1]
[8] 王圆圆, 陈云浩, 李京. RSM组合方法用于高光谱遥感数据的分类研究[J]. 遥感信息, 2008(1): 16-21.
Wang Y Y, Chen Y H, Li J. Study on RSM ensemble method for hyperspectral data classification[J]. Remote Sensing Information, 2008(1): 16-21. [本文引用:1]
[9] 刘秀英, 林辉, 熊建利, . 森林树种高光谱波段的选择[J]. 遥感信息, 2005(4): 41-44, 64.
Liu X Y, Lin H, Xiong J L, et al. Band selection from hyperspectral data of forestry species[J]. Remote Sensing Information, 2005(4): 41-44, 64. [本文引用:1]
[10] 刘春红, 赵春晖, 张凌雁. 一种新的高光谱遥感图像降维方法[J]. 中国图象图形学报, 2005, 10(2): 218-222.
Liu C H, Zhao C H, Zhang L Y. A new method of hyperspectral remote sensing image dimensional reduction[J]. Journal of Image and Graphics, 2005, 10(2): 218-222. [本文引用:1]
[11] 闫超. 基于SVM的中文文本自动分类系统的研究与实现[D]. 太原: 太原理工大学, 2010.
Yan C. Research and Implementation of Chinese Automatic Text Classification System Based on SVM[D]. Taiyuan: Taiyuan University of Technology, 2010. [本文引用:1]
[12] 谭琨, 杜培军. 基于支持向量机的高光谱遥感图像分类[J]. 红外与毫米波学报, 2008, 27(2): 123-128.
Tan K, Du P J. Hyperspectral remote sensing image classification based on support vector machine[J]. Journal of Infrared and Millimeter Waves, 2008, 27(2): 123-128. [本文引用:1]