青海湖流域土壤遥感分类
刘娟1,2, 蔡演军1, 王瑾1,2
1.中国科学院地球环境研究所黄土与第四纪地质国家重点实验室,西安 710075
2.中国科学院大学,北京 100049

第一作者简介: 刘娟(1987-),女,硕士研究生,主要从事遥感、GIS应用研究。Email:liujuan@iee.cas.cn

摘要

选择青海湖流域内一个代表性区域为试验区,以TM数据和地形数据为主要数据源,在GeoEye-1高分辨率影像和土壤图的辅助下,采用最大似然监督分类方法,探讨了遥感技术在青海湖流域土壤分类中的可行性。使用主成分分析、缨帽变换、波段组合等图像处理技术,从TM图像中提取了多种图像特征,并结合高程、坡度及坡向等地形参数,共同生成分类特征数据集进行遥感分类。研究表明,基于遥感图像和地形数据提取的分类特征,有效地区分出试验区内9个土壤亚类和1个非土壤单元,总体分类精度达到了91.76%。

关键词: 遥感; 土壤分类; TM图像; 地形数据; GeoEye-1
中图分类号:TP75 文献标志码:A 文章编号:1001-070X(2014)01-0057-06 doi: 10.6046/gtzyyg.2014.01.11
Soil classification of Qinghai Lake basin based on remote sensing
LIU Juan1,2, CAI Yanjun1, WANG Jin1,2
1.State Key Laboratory of Loess and Quaternary Geology, Institute of Earth Environment, Chinese Acdemy of Science, Xi’an 710075,China
2.University of Chinese Academy of Sciences, Beijing 100049, China
Abstract

The aim of this study is to test the feasibility of soil classification based on remote sensing in a typical area of Qinghai Lake basin. The authors employed TM image and terrain data as main data sources, and used GeoEye-1 high-resolution remote sensing images and soil map as auxiliary data sources. The TM image was processed to extract classification features by using a variety of image processing techniques, which included such means as principal component analysis, tasseled cap transformation, and band math. Supported by ArcGIS9.3 software, the authors detected several topographical features with DEM, such as elevation, slope and aspect. Then, the authors incorporated all classification features into a dataset, and used maximum likelihood classifier of supervision to classify the soil of the test area. The results suggest that the combination of remote sensing image with terrain data can distinguish nine soil subcategories and one non-soil unit. The overall classification accuracy can reach 91.76%.

Keyword: remote sensing; soil classification; TM image; terrain data; GeoEye-1
0 引言

土地这一界面是遥感图像上反映最直接的环境信息, 也是研究其他环境要素的基础[1]。土壤遥感是指通过对遥感影像的解译, 识别和划分出土壤类型, 制作土壤类型图, 分析其分布规律, 为改良和合理利用土壤服务。在常规土壤调查方法受限或需要消耗大量人力、物力、时间的地区, 基于遥感的土壤调查方法具有不可替代的优势。

目前, 国内外已开展了很多采用卫星数据和地形数据进行土壤资源调查和制图的研究。Odeh等[2]以AVHRR和DEM为数据源, 采用普通克里金等方法对土壤性质进行了研究, 并结合地形数据, 评价了各种方法的优缺点; Dobos等[3, 4]基于AVHRR 500 m, 1 000 m空间分辨率的图像, 辅以DEM数据对匈牙利土壤进行分类研究, 发现地形数据的加入对2种分辨率图像的分类精度都有显著提高, 且高分辨率图像的分类精度明显高于低分辨率图像。近年来, 国内也有不少学者借助遥感图像进行土壤调查与分类。沙晋明等[5]用TM图像, 以浙江省龙游县为例, 对我国植被覆盖率高的东南山区进行了土壤调查; 亢庆等[6, 7]基于MODIS遥感数据和地形数据, 在第二次全国土壤普查数据库的支持下, 探讨了遥感技术在常规土壤调查工作受限制的干旱地区进行土壤调查的效果和适用性。

本文根据青海湖流域内土壤的分布特点, 选取一个具有代表性的区域为试验区, 利用TM图像和地形数据, 结合青海省土壤图和高分辨率遥感图像, 综合分析了实地调查数据、遥感信息特征及植被分布情况, 并在此基础上建立了适合试验区的土壤遥感分类系统, 探讨了遥感技术在青海湖流域土壤分类中的可行性, 为该区域土壤调查和分类提供新的方法参考。

1 试验区概况

青海湖流域地处青藏高原东北部, 整个流域近似织梭形, 自西北向东南倾斜, 是一个封闭的内陆盆地, 周围山峰多在海波4 000 m以上, 最高处为西北部海拔5 291 m的岗格尔肖合力山。从相对高度2 000 m左右的山岭到湖面之间, 环带状发育着宽窄不一的侵蚀构造地貌、堆积地貌和风积地貌。青海湖流域气候类型为半干旱的温带大陆性气候。气温偏低, 寒冷期长, 没有明显四季之分, 干旱少雨, 太阳辐射强烈, 气温日较差大。流域内年平均气温在-1.1~4.0 ℃, 呈现出由东南向西北递减的趋势。流域年平均降水量在291~579 mm之间, 受地形和湖区影响, 降水分布极不均匀[8]

试验区位于青海湖流域西北部, E98° 50'27″~99° 46'32″, N37° 1'16″~37° 48'39″, 南北长70.7 km, 东西长53.5 km, 面积约为3 783 km2(图1)。试验区内有4条河流流经, 分别为布哈河、峻河、夏日哈曲和吉尔孟曲。布哈河是青海湖流域内的最大河流, 多年平均径流量为7.825× 108 m3, 占青海湖每年水源补给量的近一半。试验区内的植被类型随海拔的升高, 依次为温性草原、高寒草原、高寒草甸、高寒沼泽草甸。在高海拔地区阴坡、半阴坡, 还分布有斑块状的高寒灌丛。

图1 试验区地理位置Fig.1 Location of test area

2 数据源
2.1 遥感数据

选用青海湖流域2009年8月11日Landsat5 TM图像。该图像几乎没有云层覆盖, 且8月青海湖流域的植被信息比较丰富, 有利于分类特征的提取。同时还购买了试验区内部分地区2010年7月、2012年9月的GeoEye-1高分辨率图像, 用于分类样本和验证样本的选择。由于试验区受人类活动干扰少且土壤类型变化缓慢, 虽然高分辨率图像获取时间比TM图像晚了1~2 a, 但仍可认为二者具有土壤类型识别对比的同步性。

2.2 实地调查数据

研究人员于2009年8月29日— 9月3日和2012年9月23— 27日分别对研究区进行了实地调查。调查内容包括地形、地貌、土地利用方式、土壤要素和植被类型及覆盖度。调查时选择的土壤剖面与植被调查剖面一致, 包括多种景观类型。观察土壤剖面的颜色、质地、结构及松紧度等采样点的基本情况。根据土壤剖面颜色的不同, 分层均匀取土约200 g, 用于土壤水分、粒度等性质的测定。

2.3 土壤数据

使用了青海省测绘局1984年制作的1:100万的青海省土壤图。该土壤图是基于土壤地理发生学进行土壤类型区分的, 其基本分类单元为亚类, 涉及10个土纲, 17个土类, 48个亚类及3个非土壤单元。在ArcGIS9.3软件平台下将其矢量化, 裁剪出属于青海湖流域的部分, 然后分析青海湖流域内的土壤分布, 进而选择试验区的范围。本试验区内包括了5个土类, 10个亚类和1个非土壤单元。

2.4 地形数据

本文用到的地形数据包括: 试验区1:5万DEM数据, 其空间分辨率为25 m, 经预处理, 重采样后, 用于坡度、坡向等分类特征的提取; 试验区1:10万地形图, 主要用于TM图像的几何精纠正。

3 技术路线

本文采用最大似然方法进行分类, 技术流程如图2所示。

图2 技术路线Fig.2 Technique flow chart

4 数据预处理与分类数据集建立
4.1 数据预处理

在ENVI4.7软件平台的支持下, 以青海湖流域1:10万比例尺地形图为基准, 对青海湖流域2009年的TM图像进行几何精纠正, 并保证误差在1个像元内。选择Transverse Mercator投影, WGS84坐标系, 采用双线性内插法进行重采样, 分辨率为28.5 m。用试验区土壤图的矢量边界裁剪出试验区对应的TM图像和DEM, 用于分类特征的提取。

4.2 分类特征提取

土壤是在母质、气候、地形、生物、时间等自然因子及人为因素综合影响下发生、发展和演化的, 土壤特征反映了各种因素共同作用的结果。在遥感图像上, 不同土壤类型的特征差别不明显, 同时, 由于土壤性状主要表现在剖面上, 而不是表现在土壤表面, 因此仅依靠土壤表面电磁波谱的辐射特性来判别土壤类型并不直接。土壤与上述成土因子关系密切, 特别是受主导因素的影响较大[9], 可借助间接解译标志对其进行综合分析。

4.2.1 主成分变换分量特征

主成分变换能够实现数据压缩和图像增强, 通过该变换, 可提取植被和土壤等主要信息, 减少信息冗余和噪声对分类的影响。一般认为TM的7个波段可分为4组: 1, 2, 3; 5, 7; 4; 6。所以, 本文中将1, 2, 3波段和5, 7波段分别进行主成分变换, 取前者的第1和第2主分量, 后者的第1主分量以及TM的第4, 6波段作为分类特征, 参与分类(分别表示为PC123, 1-2; PC57, 1; TM4; TM6)。

4.2.2 缨帽变换分量特征

TM数据除热红外波段的6个波段经缨帽变换后得到3个分量。第1分量表征“ 土壤亮度” , 反映了像元总辐射水平, 集中了大部分土壤信息, 其变化主要反映了不同类别土壤的变化; 第2分量表征“ 绿度” , 与绿色植被长势、覆盖度密切相关; 第3分量为湿度指数, 对土壤水分和植物水分都比较敏感[10], 尤其反映的土壤水分状况有利于土壤分类(表示为TC1-3)[11]

4.2.3 归一化植被指数

植被可以作为土壤类型划分的重要标志, 植被指数是对地表植被活动最简单, 有效的度量。目前已经定义了40多种植被指数, 其中归一化植被指数(normalized differential vegetation index, NDVI)与植被分布密度呈线性关系, 被认为是反映植被生长状态及植被覆盖度的最佳指标[12], 即

NDVI=(NIR - Red)/(NIR + Red), (1)

式中RedNIR分别为TM3和TM4图像像元亮度值。

4.2.4 水体指数和湿度指数

Mcfeeters[13]于1996年提出了水体指数(normalized differential water index, NDWI), 它是基于绿波段和近红外波段的的归一化差异水体指数, 通常被用来提取图像中的水体信息, 如河流、湖泊等, 即

NDWI=(Green - NIR)/(Green + NIR), (2)

式中Green为TM2图像像元亮度值。

TM5波段对植物和土壤的水分含量敏感, 而TM2对水体的反射较强, 基于这2个波段的特点, 将它们经标准化处理得到湿度指数(normalized differential moisture index, NDMI)[14], 即

NDMI=(Green - SWIR)/(Green + SWIR), (3)

式中SWIR为TM5图像像元亮度值。

4.2.5 地形特征

地形是5大成土因素之一, 对土壤的形成有重要意义。试验区内多河流和高山, 相对高差较大, 所以海拔(Ele)可以参与分类。此外, 坡度(Slo)、坡向(Asp)和表面曲率(Cur)可改变水、热及植被状况, 从而影响土壤的发育, 因此它们也可以参与分类。

4.3 分类特征数据集的建立

将以上得到的15个分类特征进行组合, 得到分类特征数据集。在ArcGIS9.3中, 将GPS中的实地采样点生成矢量样点图, 配准之后与遥感图像进行叠加, 并分析它们在遥感图像上的特点。

5 土壤遥感分类及分类特征分析
5.1 训练样本采集

将裁剪出的研究区域的1:100万土壤矢量图以相同的地理坐标系叠加到TM图像上, 结合实地调查数据、高分辨率遥感图像, 在各个土壤类型中按照约3:1的比例采集训练数据和验证数据。采集样本过程中应注意以下3个问题:

1)分布在不同区域的相同类型的土壤, 应分别对各个区域采集样本。原因在于它们在遥感图像上表现出的景观特征可能存在差异, 即使在同一区域内, 景观特征可能也不同。例如: 在研究区中有2个区域是草甸沼泽土, 但是它们在景观特征上却有很大差异, 且在其中一个较大的区域中, 也存在2种不同的景观类型, 所以将草甸沼泽土分为3个区域分别采集样本。此外, 普通高山草甸土也有同样问题, 根据实际情况, 分为3个区域分别采集样本。

2)避免在土壤类型的交界处选择样本。

3)河流附近的土壤类型比较复杂, 故不宜在近河流处采集样本。

5.2 可分离性分析

本文选择ENVI中Jeffries-Matusita, 即J-M距离来衡量训练样本的可分离性。其取值在0.0~2.0之间, 值越大说明类对之间的可分性越好, 一般认为大于1.9的类对之间具有较好的可分性。本研究以1.9作为类对合并的阈值, 对J-M距离小于1.9的类对进行合并(表1)。

表1 J-M距离小于1.9的部分土壤类对 Tab.1 Soil pairs which J-M distances is less than 1.9
5.3 类别合并

根据J-M距离, 对可分离性不高的土壤类别进行合并。将草甸沼泽土2, 3与泥炭沼泽土进行合并, 合并后统称为草甸泥炭沼泽土。草甸沼泽土1与其他亚类均可分, 还称为草甸沼泽土。把普通高山草甸土和碳酸盐高山草甸土也进行合并, 统称为高山草甸土, 且合并后的高山草甸土与草甸沼泽土、草甸土可分, J-M距离为1.90。进行类别合并后试验区有9个土壤亚类和一个非土壤单元。

5.4 分类特征分析

将不同的分类特征进行组合, 并分析较难区分的类对之间的可分离性, 具体情况见表2, 3。

表2 分类特征组合 Tab.2 Groups of classification feature
表3 不同分类特征组合的J-M距离分析 Tab.3 Analysis of J-M distances with different groups of classification feature

表3可以看出: 随着参与分类的特征数量的增加, 土壤类对之间的J-M距离也随之增大, 说明所选择的分类特征是有效的。组合3的效果比组合2略好, 即对于分类NDMI比NDWI更有效。但是为了更好地区分土壤类对之间的可分性, 这2个分类特征都将参与分类。组合5中加入了海拔, 大大提高了土壤类对之间的可分性, 使其中6个土壤类对由不可分到可分。尤其是草甸沼泽土、草甸土-草甸泥炭沼泽土和草甸沼泽土-沼泽盐土, 它们的J-M距离分别由1.68和1.52提高到1.98和2.00。组合6— 8是在组合5的基础上分别加入了坡度、坡向、曲率, 它们的加入都不同程度地提高了土壤类对之间的可分性。但是对于栗钙土-暗栗钙土来说, 坡度和曲率的效果比坡向要好。

5.5 土壤遥感分类

虽然有些分类特征对土壤类对可分性的贡献效率不高, 但是为了更有效地区分土壤类对, 将以上15个分类特征都参与到试验区的遥感土壤分类中。图3为采用最大似然方法得到的分类图。

图3 试验区土壤遥感分类图Fig.3 Soil map of the test area

6 分类精度检验及分析

采用混淆矩阵进行精度评价, 结果见表4

表4 混淆矩阵 Tab.4 Confusion matric

表4可知, 由本文方法计算得到总体分类精度为91.76%, Kappa系数为0.895 7。各土壤类型的错分误差和漏分误差见表5

表5 分类误差分析 Tab.5 Error analysis of classification (%)

结合表4表5发现, 暗栗钙土的错分误差是将属于自己的像元错分为栗钙土, 而栗钙土的漏分误差则是暗栗钙土的错分造成的。栗钙土和暗栗钙土是栗钙土下面的2个亚类, 它们在水分、植被方面有着相似性(图3), 造成了界线的模糊, 所以在边缘部分遥感区分难度较大。前面的分类特征分析时也曾提到, 坡度和曲率对栗钙土-暗栗钙土的可分性贡献度很大, 而坡度和曲率的变化在2个土壤亚类的边界也是一个渐变的过程。泥炭土的错分误差为27.59%, 原因是把本该属于自己的像元错分为草甸泥炭沼泽土。试验区内泥炭土的分布面积很小, 而草甸泥炭沼泽土的分布面积很大, 泥炭土与草甸泥炭沼泽土中的某些区域具有及其相似的景观特征, 经调查它们的植被覆盖均为高寒沼泽草甸。

此外, 草甸沼泽土、草甸土的部分像元被误分为高山草甸土, 导致错分误差也很大。这是因为本研究所参考的土壤图上, 草甸沼泽土、草甸土本来就是1个合并类, 所以比较容易混淆。但归根结底还是因为它们分布范围内的生物和地理因素比较相似。

7 结论

本研究以TM图像和地形数据为主, 高分辨率遥感图像和土壤图为辅, 参照土壤发生分类系统, 对试验区土壤进行了遥感分类研究, 并对分类结果进行了精度验证和分析。

1)研究中所采用的从遥感图像和DEM中提取的土壤分类特征, 对于该尺度的土壤类型区分是有效的, 能够较好地区分出大部分的土壤亚类; 但对于某些光谱特征和地形条件相似的亚类, 区分度不高, 需要进行类别的合并等调整。这也说明了土壤发生分类系统并不直接适用于遥感分类。

2)在青海湖流域这种地形复杂的区域, 高分辨率遥感图像的参与对样本选择具有一定的作用。

3)试验区范围有限, 训练样本的采集相对较简单, 如果对整个青海湖流域进行土壤遥感分类, 训练样本的采集将会比较困难, 而且分类精度将会有所降低, 所以本文所研究的土壤遥感分类系统在整个青海湖流域的推广还有待进一步研究和验证。

The authors have declared that no competing interests exist.

参考文献
[1] 赵英时. 遥感应用分析原理与方法[M]. 北京: 科学出版社, 2003.
Zhao Y S. The principles and methods for analysis and application of remote sensing[M]. Beijing: Science Press, 2003. [本文引用:1]
[2] Odeh I O A, McBratney A B, Chittleborough D J. Further results on prediction of soil properties from terrain attributes: Heterotopicco kriging and regression-kriging[J]. Geoderma, 1995, 67(3/4): 215-226. [本文引用:1] [JCR: 2.345]
[3] Dobos E, Micheli E, Baumgardner M F, et al. Use of combined digital elevation model and satellite radiometric data for regional soil mapping[J]. Geoderma, 2000, 97(3/4): 367-391. [本文引用:1] [JCR: 2.345]
[4] Dobos E, Montanarella L, Negre T, et al. A regional scale soil mapping approach using integrated AVHRR and DEM Data[J]. International Journal of Applied Earth Observation and Geoinformation, 2001, 3(1): 30-42. [本文引用:1] [JCR: 2.176]
[5] 沙晋明, 史舟, 王人潮, . 东南山区土壤遥感监测的图像处理及分类[J]. 水土保持学报, 2000, 14(1): 38-43, 47.
Sha J M, Shi Z, Wang R C, et al. Image processing and classification of soil surveying by remote sensing in southeast mountain area[J]. Journal of Soil and Water Conservation, 2000, 14(1): 38-43, 47. [本文引用:1] [JCR: 1.722] [CJCR: 1.409]
[6] 亢庆, 张增祥, 赵晓丽. 基于MODIS产品的区域土壤遥感分类研究——以新疆为例[J]. 遥感技术与应用, 2007, 22(6): 690-695.
Kang Q, Zhang Z X, Zhao X L. A regional scale soil classification approach based on MODIS data[J]. Remote Sensing Technology and Application, 2007, 22(6): 690-695. [本文引用:1] [CJCR: 0.749]
[7] 亢庆, 张增祥, 赵晓丽. 基于遥感技术的干旱区土壤分类研究[J]. 遥感学报, 2008, 12(1): 159-167.
Kang Q, Zhang Z X, Zhao X L. A study of soil classification based on remote sensing in arid area[J]. Journal of Remote Sensing, 2008, 12(1): 159-167. [本文引用:1] [CJCR: 0.992]
[8] 陈桂琛, 陈孝全, 苟新京. 青海湖流域生态环境保护与修复[M]. 西宁: 青海人民出版社, 2008: 18-39.
Chen G S, Chen X Q, Gou X J. Protection and restoration of the ecological environment at Qinghai Lake basin[M]. Xining: The Peoples Press of Qinghai, 2008: 18-39. [本文引用:1]
[9] 梅安新, 彭望琭, 秦其明, . 遥感导论[M]. 北京: 高等教育出版社, 2001.
Mei A X, Peng W L, Qin Q M, et al. Introduction to remote sensing[M]. Beijing: Higher Education Press, 2001. [本文引用:1]
[10] 罗红霞, 龚健雅, 蹇代君. 亚热带低山丘陵区土壤遥感监测图像处理[J]. 长江流域资源与环境, 2006, 15(1): 41-47.
Luo H X, Gong J Y, Jian D J. Image processing of soil survey by remote sensing in subtropical hilly land s[J]. Resources and Environment in the Yangtze basin, 2006, 15(1): 41-47. [本文引用:1] [CJCR: 1.536]
[11] Crist E P, Cicone R C. A physically-based transformation of thematic mapper data-the TM tasseled cap[J]. IEEE Transactions on Geoscience and Remote Sensing, 1984, 22(3): 256-263. [本文引用:1] [JCR: 3.467]
[12] 邓书斌. ENVI遥感图像处理方法[M]. 北京: 科学出版社, 2010.
Deng S B. Image processing methods of remote sensing by ENVI[M]. Beijing: Science Press, 2010. [本文引用:1]
[13] Mcfeeters S K. The use of normalized difference water index(NDWI)in the delineation of open water feature[J]. International Journal of Remote Sensing, 1996, 17(7): 1425-1423. [本文引用:1]
[14] 赵英时. 美国中西部沙山地区环境变化的遥感研究[J]. 地理研究, 2001, 20(2): 213-219.
Zhao Y S, A study on environmental change analysis in sand hill of Nebraska using remote sensing[J]. Geographical Research, 2001, 20(2): 213-219. [本文引用:1]