基于SVM的湖泊咸度等级遥感信息提取方法——以内蒙古巴丹吉林沙漠为例
刁淑娟1, 刘春玲2, 张涛2, 贺鹏2, 郭兆成2, 涂杰楠2
1.中国地质图书馆,北京 100083
2.中国国土资源航空物探遥感中心,北京 100083

第一作者简介: 刁淑娟(1965-),女,硕士,教授级高级工程师,长期从事遥感技术应用研究和期刊编辑出版工作。Email:zgdzdc_dsj@126.com

摘要

以Landsat8 OLI图像为信息源,在完成几何纠正、配准及镶嵌等图像预处理的基础上,对内蒙古巴丹吉林沙漠湖泊进行光谱信息提取; 结合实地采集的湖泊咸度等级样本,分析湖泊咸度光谱特征及其遥感信息特征,提出了基于支持向量机(support vector machine,SVM)的咸度等级分类方法和咸度区划分方案,实现了对巴丹吉林沙漠湖泊咸度等级遥感信息的提取。研究结果表明,该方法能有效地解决湖泊咸度样本数量较少、样本间光谱信息差异较小、采用常规分类方法难以取得较好效果情况下的湖泊咸度信息提取问题,有一定的推广应用价值。

关键词: 湖泊咸度等级; 信息提取; 支持向量机(SVM); 光谱分析; 巴丹吉林
文献标志码:A 文章编号:1001-070X(2016)04-0114-05 doi: 10.6046/gtzyyg.2016.04.18
Extraction of remote sensing information for lake salinity level based on SVM: A case from Badain Jaran desert in Inner Mongolia
DIAO Shujuan1, LIU Chunling2, ZHANG Tao2, HE Peng2, GUO Zhaocheng2, TU Jienan2
1.National Geological Library of China, Beijing 100083, China
2. China Aero Geophysical Survey and Remote Sensing Center for Land and Resources, Beijing 100083, China
Abstract

According to the problems of remote sensing information extraction in lake salinity level of Badain Jaran desert, the authors put forward a method based on support vector machine (SVM). In this paper, the authors adopted Landsat8 OLI remote sensing image as the data source, completed the image preprocessing such as geometric correction, image registration and mosaicking. With the help of the RS and GIS technology, the authors successfully extracted the information of lake salinity levels of the Badain Jaran desert. The results show that the proposed method can effectively solve the problems of less samples and the information extraction of lake salinity levels when the spectral information is confused, and hence has the reference value and can be promoted to other similar situations.

Keyword: lake salinity levels; information extraction; support vector machine(SVM); spectral analysis; Badain Jaran
0 引言

内蒙古巴丹吉林沙漠以其独特的风沙地貌和沙漠腹地深处形态各异的湖泊景观闻名于世。据前人统计, 在巴丹吉林沙漠现存的100多个湖泊中, 常年有水的就超过70多个, 这一现象实为罕见。沙漠内部的湖泊及周边的湿地是牧民们种植及放牧依托的根本, 从湖泊周边浅井内获取的地下水也是牧民们的主要饮用水, 因此, 查明该区的湖泊咸度非常必要。早在21世纪70年代末, 我国学者已对该区现存内陆湖泊的分布、补给来源及地下水系统等特征做了大量研究[1, 2], 但对湖泊咸度的研究较少。

支持向量机(support vector machines, SVM)是一种基于统计学理论的监督学习算法, 即通过对偶优化形式在高维特征空间中寻找最优分类超平面, 解决复杂数据的分类及回归问题[3, 4]。该算法已经被广泛应用于土地覆盖遥感分类。Pal[5]提出非穷尽搜索与遗传算法(genetic algorithms, GA)结合 SVM 的分类方法, 并将其应用于土地覆盖分类。Carrao 等[6]利用 SVM 分类方法对多光谱 MODIS 数据进行处理, 解决了土地利用分类问题。Nemmour等[7] 利用Landsat图像进行城市变化监测, 试验结果表明 SVM 方法的分类效果优于神经网络方法。王朔琛[8]研究了基于半监督SVM的图像分类方法。李驰[9]完成了基于SVM的超分辨率图像重建。笔者从上述研究得到启示, 考虑到研究区湖泊咸度样本数量较少, 且样本间光谱信息差异较小, 采用常规分类(如最大似然分类)方法难以取得较好效果, 而SVM方法对小样本高维数据分类具有优势, 因此将其引入到湖泊咸度等级信息的提取中, 探讨该方法的可行性和实用性。

为全面了解巴丹吉林沙漠区内湖泊的分布及咸淡情况, 摸清其资源潜力及潜在经济价值, 促进当地社会与经济可持续发展, 本文在1∶ 25万水文地质遥感调查工作基础上, 通过引入SVM技术, 成功实现了对该区湖泊咸度等级遥感信息的自动提取。

1 研究区概况及数据源

研究区巴丹吉林沙漠又称巴丹扎兰格沙漠, 系中国第三大沙漠, 位于中国北部阿拉善高原腹地。沙漠东南部以雅布赖山为界, 西北与古日乃湖盆区相接, 东依宗乃山, 西靠古日乃湖, 北连拐子湖, 南临合黎山和北大山, 总面积约4.92万k m210。地势自东南向西北部缓缓倾斜降低, 过黑河以西后又逐渐回升, 其中吉诃德沙山是世界上最高的沙丘(图1)。

图1 研究区位置Fig.1 Position of study area

巴丹吉林沙漠地区属大陆性气候, 年均温度为7~8℃, 多年平均降水量由东南向西北部逐渐减少, 东南部约为120 mm, 西北部则不足40 mm。区内植被覆盖度很低, 且风沙频繁, 风力强劲。巴丹吉林沙漠虽然气候极为干旱, 但是其中的湖泊竟然多达100多个, 面积多在0.1~1.0 km2 之间, 为全世界所罕见[11]

以2014年7月17日获取的覆盖巴丹吉林沙漠Landsat8 OLI遥感图像为数据源, 进行了几何纠正、配准及镶嵌等图像预处理。

2 湖泊咸度等级遥感信息提取

研究区Landsat8数据预处理后, 对湖泊光谱信息进行提取; 结合实地采集的湖泊咸度等级样本, 分析不同咸度等级湖泊水体的光谱特征; 然后采用SVM分类方法, 提取巴丹吉林沙漠区内各个湖泊的咸度等级。其技术流程如图2所示。

图2 湖泊咸度等级遥感信息提取技术流程Fig.2 Technical process of extraction of remote sensing information for lake salinity levels

2.1 湖泊样本的光谱特征分析

为了得到巴丹吉林沙漠区内所有湖泊的咸度等级, 通过查阅现有地质图和检索他人研究成果, 结合实地考察, 获取了该区内37个湖泊样本的实际含盐度数据资料。将这些湖泊样本的咸度分为4个等级(表1), 各咸度等级样本的空间分布如图3所示。

表1 巴丹吉林沙漠湖泊的咸度分级 Tab.1 Salinity classification of lakes in Badain Jaran deser

图3 湖泊咸度等级样本空间分布Fig.3 Spatial distribution of salinity level samples

以2014年7月17日获取的Landsat8 OLI图像为信息源, 采集上述样本的光谱曲线(图4)。

图4 样本的光谱曲线Fig.4 Spectral curves of samples

图4可以看出, 不同咸度等级样本的光谱曲线形态和变化趋势是类似的, DN值随波长的增大而减小。另外, 随着咸度等级降低, DN值整体有升高趋势。从每个咸度等级的样本中分别取出1个典型样本, 制做出4个典型样本的光谱特征曲线(图5)。

图5 4个典型样本的光谱曲线Fig.5 Spectral curves of four typical samples

图5可以看出, 在同一个波段, 随着咸度等级降低, DN值逐渐增大。另外, 相对于蓝(B)和 绿(G)波段, 红(R)、近红外(NIR)、短波红外(SWIR1)和中红外 (SWIR2)波段对咸度等级的区分度更高。因此, 本文将红、近红外、短波红外及中红外波段组合起来, 形成一个新的组合波段(记作: BR+BNIR+BSWIR1+BSWIR2)。不同咸度等级样本的DN值见图6

图6 不同咸度等级样本的DN(BR+BNIR+BSWIR1+BSWIR2)Fig.6 DN(BR+BNIR+BSWIR1+BSWIR2) of samples with different salinity levels

图6可以看出, 随着咸度等级的增加, DN值明显下降, 且“ 咸度1” 和“ 咸度2” 与“ 咸度3” 和“ 咸度4” 之间有很高的区分度。

2.2 湖泊光谱特征提取

对于Landsat8 OLI卫星数据来说, 巴丹吉林沙漠的湖泊一般都包含了众多的水体像元。选择有代表性的水体像元代表各个湖泊的光谱信息, 对湖泊咸度等级遥感分类十分重要。位于湖泊边缘区域的水体深度较浅, 容易受底部物质的影响。因此, 本文以每个湖泊多边形的重心为基准, 提取重心位置像元的光谱信息, 作为该湖泊的光谱特征。

所提取的光谱特征共有7个维度, 包括Landsat8 OLI的第2―7波段, 另外增加了组合波段(BR+BNIR+BSWIR1+BSWIR2)。

2.3 湖泊咸度等级SVM分类

本文采用LibSVM库实现SVM分类。SVM分类需要设置一些参数。首先将原始的各个特征归一化到[0, 1]范围, 以便输入SVM; 然后选择径向基函数(radial basis function, RBF), 在实际测试中, RBF核优于线性核函数和多项式核函数; 最后对参数C与参数γ 采用交叉验证方法进行优化, 选择最佳的Cγ 进行SVM的训练与分类。

3 湖泊咸度等级提取结果

针对巴丹吉林沙漠东南部提取的122个湖泊, 采用本文方法将湖泊咸度分为4个等级, 其中, 咸度等级为1的淡水湖有9个, 咸度等级为2的微咸湖有10个, 咸度等级为3的咸水湖有40个, 咸度等级为4的盐水湖有63个。咸度等级提取结果见图7

图7 巴丹吉林湖泊咸度等级提取结果Fig.7 Extraction result of lake salinity levels in Badain Jaran desert

图7可以看出, 不同咸度级在空间分布上存在明显的规律。根据不同咸度级湖泊在空间上的聚集关系, 以NE走向的2条分界线将巴丹吉林沙漠东南部湖泊分成3个区, 从东南部向西北部, 分别对应“ 低” 、“ 中” 、“ 高” 3个咸度分区。其中, 低咸度区以淡水湖泊(咸度级1级湖泊)及微咸水湖泊(咸度级2级湖泊)为主, 中咸度区以咸水湖泊(咸度级3级湖泊)为主, 高咸度区以盐水湖泊(咸度级4级湖泊)为主。

4 咸度等级提取结果的准确性分析

为了验证SVM法在湖泊咸度等级遥感信息提取中的准确性, 对巴丹吉林沙漠内湖泊咸度遥感信息提取结果进行了野外验证。因受实际条件所限, 野外实际验证点数为26个, 验证结果见图8表2

图8 巴丹吉林湖泊实测咸度等级空间分布Fig.8 Spatial distribution of lake salinity levels measured in Badain Jaran desert

图8表2可以看出, 咸度等级为1级信息提取点与实测点相符, 正确率为100%; 咸度等级为2级信息提取点与实测结果相符的为5个, 其余2个实测点咸度等级为3级, 准确率为71.43%; 咸度等级为3级的信息提取点与实测结果相符的为6个, 剩余1个实测点的咸度等级为2级, 准确率为85.71%; 咸度等级为4级的信息提取点与实测结果相符的为7个, 剩余1个实测点的咸度等级为3级, 准确率为87.50%。对比各咸度等级的信息提取结果与实测结果表明, 总体正确率约为84.62%, 利用遥感手段所提取的结果较为理想。

表2 湖泊咸度遥感信息提取与野外实地验证结果对比 Tab.2 Comparison between results of lake salinity information extraction and field validation
5 结论

本文基于支持向量机(SVM)的方法, 以Landsat8 OLI遥感图像为数据源, 成功提取了内蒙古巴丹吉林沙漠湖泊咸度等级遥感信息。从遥感调查成果可以看出, 巴丹吉林沙漠东南部湖泊的咸度等级存在明显的空间分异规律: 淡水(微咸水)主要分布于湖泊区的东南角; 从东南向西北方向, 湖水咸度不断增加。依据巴丹吉林沙漠湖泊咸度等级的空间聚集规律进行的咸度区划分, 可为沙漠湖泊地下水补给机制分析提供参考, 对解决当地人、畜饮水难题, 促进当地社会与经济可持续发展均有极其重要的意义。

The authors have declared that no competing interests exist.

参考文献
[1] 梁永平, 赵春红, 唐春雷, . 北方岩溶区水文地质环境调查进展——以北京西山岩溶区为例[J]. 中国地质调查, 2015, 2(8): 1-8.
Liang Y P, Zhao C H, Tang C L, et al. Progress of hydrogeology and environmental geology survey in Karst Area of northern China: An example from karst area in western hills of Beijing[J]. Geology Survey of China, 2015, 2(8): 1-8. [本文引用:1]
[2] 苏春田, 潘晓东, 李兆林, . 云南广南岩溶区水文地质环境地质调查进展[J]. 中国地质调查, 2015, 2(8): 9-16.
Su C T, Pan X D, Li Z L, et al. Progress of hydrogeology and environment geology survey in Guangnan karst area, Yunnan province[J]. Geology Survey of China, 2015, 2(8): 9-16. [本文引用:1]
[3] Vapnik V N. The Nature of Statistical Learning Theory[M]. New York: Springer-Verlag, 1995. [本文引用:1]
[4] Pal M, Mather P M. Support vector machines for classification in remote sensing[J]. International Journal of Remote Sensing, 2005, 26(5): 1007-1011. [本文引用:1]
[5] Pal M. Support vector machine-based feature selection for land cover classification: A case study with DAIS hyperspectral data[J]. International Journal of Remote Sensing, 2006, 27(14): 2877-2894. [本文引用:1]
[6] Carrão H, Gonçalves P, Caetano M. Contribution of multispectral and multitemporal information from MODIS images to land cover classification[J]. Remote Sensing of Environment, 2008, 112(3): 986-997. [本文引用:1]
[7] Nemmour H, Chibani Y. Fuzzy neural network architecture for change detection in remotely sensed imagery[J]. International Journal of Remote Sensing, 2006, 27(4): 705-717. [本文引用:1]
[8] 王朔琛. 基于半监督支持向量机的图像分类方法研究[D]. 西安: 陕西师范大学, 2015.
Wang S C. Research on Image Classification Based on Semi Supervise Support Vector Machine[D]. Xi’an: Shaanxi Normal University, 2015. [本文引用:1]
[9] 李驰. 基于支持向量机的超分辨率图像重建[J]. 激光杂志, 2016, 37(1): 138-141.
Li C. Super resolution image reconstruction based on support vector machine[J]. Laser Journal, 2016, 37(1): 138-141. [本文引用:1]
[10] 吴正. 风沙地貌与治沙工程学[M]. 北京: 科学出版社, 2003.
Wu Z. Control Engineering of Sand Physiognomy[M]. Beijing: Science Press, 2003. [本文引用:1]
[11] 丁宏伟, 王贵玲. 巴丹吉林沙漠湖泊形成的机理分析[J]. 干旱区研究, 2007, 24(1): 1-7.
Ding H W, Wang G L. Study on the formation mechanism of the lakes in the Badain Juran desert[J]. Arid Zone Research, 2007, 24(1): 1-7. [本文引用:1]