第一作者简介: 杨宇晖(1990-),女,硕士研究生,主要研究方向为遥感与地理信息系统应用。Email:yangyuhui0216@163.com。
复杂流域地物混杂,因受背景干扰,对混杂在不同背景地物中的目标地物很难用1个规则区分出来。基于Landsat8多波段影像,以湘江的Ⅰ级支流蒸水河流域和长江三角洲的3大城市为研究区,采用最大似然法进行初步分类; 分析混杂地物的光谱特征,探讨区分混杂地物的决策规则,对水体、人工建筑、耕地、裸地、林地和裸岩等基本地物进行分类。结果表明,蒸水河流域分类的整体精度达到88.21%,高于监督分类精度(79.68%); 其他3个长江三角洲城市的分类精度都在92%以上。所提出的混杂地物区分模型可以提高混杂在不同背景中的同类地物的分类精度。
Mixed ground objects in complex basin are easily interfered by background, and foreground mixed in different ground objects is difficult to be distinguished by one rule. In this paper, the authors discuss the classification rule model of common ground feature in different mixed backgrounds. With Landsat8 images as the data source, level 1 tributary of Zhengshui River basin in Xiangjiang River basin and the three big cities of the Yangtze River delta as the study areas, the authors adopted the maximum likelihood method to conduct a preliminary classification. Based on analyzing the spectral characteristics of mixed feature, the authors built the classification decision tree of mixed ground feature to identify water, artificial construction, farmland, bare land, forest land and bare rock. The results obtained by the authors show that the overall accuracy of the Zhengshui River is about 88.21%, which is higher than the supervised classification accuracy of 79.68%, and the overall accuracy of other three cities along the Yangtze River is higher than 92%. It is shown that the classification model for mixed subjects can improve the accuracy of the same ground objects with different backgrounds.
遥感因其同步观测面积大、时效性强、经济效益大等特点, 可迅速而准确地全方位监测土地资源的利用情况, 实时掌握土地资源的利用信息, 为土地资源的合理利用和科学管理提供技术支撑[1]。遥感影像分类是获取地物属性信息的重要手段。由于地物反射光谱存在“ 同物异谱” 和“ 异物同谱” 现象, 尤其对于反射特性相似的地物, 遥感影像分类难免会有类别混淆和错分现象[2]; 而混杂于不同地物背景下的同类地物会呈现不同的光谱特征而被区分为不同类型。这也正是传统监督分类在处理复杂地形和杂乱地物时精度不高的根本原因[3]。我国南方丘陵地区因地势崎岖、干扰因子多, 故对丘陵地区的影像解译要比平原地区困难得多, 遥感分类出现错分和漏分的情况会更为明显。
传统的监督分类是利用地物光谱的普遍规律进行统计分析和归类, 因而很难处理不同背景地物光谱的干扰; 面向对象的分类方法虽然主要针对“ 同物异谱” 现象进行分割和分类, 但在面对小而破碎的地物时也常常无能为力[4]。因此, 基于对不同背景下地物光谱特征的分析, 能否采取适宜的数据处理及分类方法变得十分重要。决策树分类法利用典型地物的反射光谱曲线分析类别间的光谱特征差异, 因地制宜地定义分类规则, 最大限度地挖掘不同地物间的光谱差异进行地物分类; 并可根据分类结果灵活地修改不完善的规则, 在监督分类的基础上进一步提高分类精度, 为后续决策提供保障[5]。本文拟在传统方法监督分类结果的基础上, 建立混杂于不同背景下的地物区分决策模型。
选择湖南省的蒸水河流域和长江三角洲的苏州市、上海市和杭州市作为研究区, 它们的共同特点是地处长江以南, 气候湿润, 水网密布, 植被茂盛, 物产富饶, 地形复杂多变。蒸水河流域属于长江支流湘江的Ⅰ 级支流, 发源于湖南省邵阳市的邵东县最高峰大云山脚下, 全长约200 km; 地处大陆性亚热带季风湿润气候区, 四季分明, 水热丰沛, 年均降雨1 500 mm左右, 易发生洪涝或干旱; 流域内地形以丘陵为主, 水网密布, 地表破碎。
利用航天飞机雷达地形测绘使命(shuttle Radar topography mission, STRM)数据在ArcGIS相应工具中生成DEM数据, 进而生成流域轮廓, 通过拼接裁剪得到蒸水河流域和长江三角洲的遥感影像。选用美国陆地卫星Landsat8陆地成像仪(operational land imager, OLI)于2013年9月19日获取的B1―B7波段影像数据, 光谱波段有蓝(B1, B2)、绿(B3)、红(B4)、近红外(B5)和短波红外(B6, B7), 空间分辨率为30 m。对各波段影像进行辐射校正后, 再做几何精纠正和影像配准, 误差小于1个像元。根据经验, 本文选择OLI的B5(R)B4(G)B3(B)波段组合数据, 获得假彩色合成影像, 以提高影像的直观目视效果。
研究区土地覆盖主要有水体、人工建筑、耕地, 林地、裸岩、裸土和耕地2(已收割)等7类。在秋收季节, 收割后耕地的影像特征与裸地非常相似, 但与未收割耕地的光谱差异较大, 因此可将已收割的耕地单独分为1类。虽然决策树分类的方法原理与其他监督分类一样, 都是基于对地物光谱和影像特征的分析[6, 7], 但它又作为一种基于空间数据挖掘和知识发现的监督分类方法, 在遥感分类问题上表现出很大的优势, 如训练速度快、执行快; 对数据分布形式不做假设, 可获得非线性的映射; 非黑箱式操作, 可形成易于人们理解的规则, 具有内置的特征选择能力等[8]。
多光谱影像特征在分类和信息提取过程中至关重要[9]。本文以光谱特征为主, 利用ENVI软件中的感兴趣区域(region of interest, ROI)工具选取各种典型地物的样本数据, 并统计得出不同地物的反射光谱特征。取各波段的平均值, 得到了各类地物的反射光谱曲线(图1)。
从图1可以看出, 各类地物反射特征的区别主要表现在B4―B7波段。在建立样本训练区进行监督分类时, 通常会在同种地物大片集中处获取训练样本的特征, 以保证样本的纯净度; 但却忽略了复杂地表和破碎地带不同地物间的相互干扰现象, 导致地物边缘带像元分类精度受损。在江南丘陵地区, 此问题就变得尤为突出, 因此, 了解地物间光谱相互干扰导致的“ 同物异谱” 程度并寻求解决方案, 可以提高分类精度。以OLI B5波段影像为例, 分析影像中同种地物在不同地物背景下的各波段像元亮度平均值(表1)。
![]() | 表1 不同背景下同种地物的混杂光谱特征 Tab.1 Mixed spectrum characteristic of same subject under different background |
由表1可以看出, 同种地物混杂在其他地物中的光谱反射值会与单纯该地物的光谱反射值有所差别, 一般会更加趋近背景地物的光谱反射值。利用这一点, 分析各波段光谱反射值和其他指数与特征, 为进一步分类提供可靠依据。
1)水体。由于水体受污染程度不同, 在影像中有时会呈暗灰色; 而城镇建筑较为密集的区域因受光照角度的影响, 在影像中则呈较亮的灰黑色, 两者较易混淆。归一化差异建筑指数(normalized difference building index, NDBI)可较好地将人工建筑物与其他地物区别开来, 利用NDBI< -0.15可将混分到建筑中的水体大致分出。由于不同地物像元亮度值有所差异, 所以利用(B3-B4)> 0 且B7> 5 120可将混在水体中的建筑提取出来。归一化差异植被指数(normalized difference vegetation index, NDVI)利用近红外与红光波段的反射值之差除以两者之和, 不仅可用于提取植被, 也是反映农作物长势和营养信息的重要参数之一。混在水体中的耕地可利用植被指数NDVI> 0.3大致分出; 由于林地和水体在B5波段上差值很大, 可利用B5> 1 330直接将混在水体中的林地提取出来。
2)植被。单纯利用NDVI指数还不能足以区分不同的植被类型, 尤其是耕地与林地的NDVI指数均大于0, 一般情况下林地的植被覆盖度大于耕地, 因此林地的NDVI指数一般也大于耕地。但因研究区面积较大, 且地物破碎, 难以确定某个适当阈值单纯地利用NDVI指数将耕地与林地区分开。引入B4波段影像的纹理信息熵Entropy> 2.1, 可提取混在耕地中的林地[9]。秋季耕地收割前后的反射率差别较大, 但已经收割的耕地与人工建筑在影像上容易混淆, 利用NDVI> 0.15可将混在建筑中的耕地提取出来。
3)裸土。一般分布在城镇尚未完成建设的施工工地和部分裸露山体上, 多呈灰白或高亮度, 容易与建筑物混淆。利用NDBI指数可将混在建筑中的裸土提取出来, 由不同地物各波段光谱图(图1)可以看出, 人工建筑在B5到B6波段呈现明显下降趋势, 而裸土在B5和B6波段呈轻微下降趋势, 因此可简单地利用(B5-B6)> 500提取出混在裸土中的人工建筑; 利用(B2+B3-B4+B5)< 1 550 可提取出混在建筑里的裸土。
4)建筑。根据上述规则基本上可将建筑与水体、植被、裸土分开。其余地物可用0< NDBI< 0.035将混在耕地2中的建筑提取出来。
即使是同种地物, 在混于不同背景地物的情况下所采用的识别规则也有所不同, 需根据目标类与背景类2种地物在特征波段的光谱特征进行具体分析, 从而寻求有效规则[10]。例如耕地2为目标类时, 可采用植被指数将耕地2与背景地物区分开。耕地2虽是收割后的耕地, 但与裸土相比会有少许残留植被, NDVI指数比裸土高, 故利用NDVI> 0.15可将以裸土为背景的耕地2提取出来; 而邻近水域的耕地收割后残留植被比远离水域的耕地要多, 加上近年来水体污染富营养化, 水生植被茂盛, 要将水边的耕地2提取出来需要设置更高的阈值, 因此利用NDVI> 0.3可将水体周围的耕地2提取出来。人工建筑以水体为背景时, 由于两者在B3, B4波段影像的反射值变化走向与B7波段影像的反射值差异较大, 可利用(B3-B4)> 0且B7> 5 120将水体背景下的人工建筑有效提取。根据光谱特征图(图1)发现, 人工建筑在B6波段呈现明显下降, 而裸土在B6波段上则呈上升趋势, 利用(B5-B6)> 500可将以裸土为背景的建筑物提取出来。耕地2为收割后的耕地, 建筑指数为负值, 以耕地2为背景的人工建筑可利用NDBI指数提取出来。耕地为目标类时, 可以通过调整NDVI值, 利用NDVI> 0.15将人工建筑背景下的耕地有效地提取出来。林地为目标类时, 在耕地背景下很难利用NDVI寻求适当阈值将其提取, 在纹理分析时发现两者在B4波段上的熵值有明显差别, 利用信息熵Entropy> 2.1可将在耕地背景下的林地提取出来。水体在B5波段的反射值远小于其他地物, 因此水体背景下的林地可简单地通过B5> 1 330提取出来。
本文构建的混杂地物识别模型如图2所示。
对研究区进行最大似然法监督分类, 通过光谱和特征分析建立混杂地物区分模型, 利用模型对监督分类结果经过决策树分类改进, 以识别提取混在不同背景的地物, 结果发现, 混杂现象得到了很大程度的改善。蒸水河流域部分地区分类结果对比如图3。
利用随机散点进行蒸水河流域2种分类(监督分类和本文模型)的精度评价混淆矩阵见表2和3。
![]() | 表2 蒸水河流域最大似然监督分类混淆矩阵 Tab.2 Confusion matrix of supervised classification by maximum likelihood for Zhengshui River watershed(像元数) |
![]() | 表3 蒸水河流域混杂地物识别模型分类混淆矩阵 Tab.3 Confusion matrix of classification by of mixed subject model for Zhengshui River watershed(像元数) |
对长江三角洲地区3大城市2013年OLI影像的混杂地物识别模型精度评价的总精度(Kappa 系数)分别为: 上海94.831%(0.934)、苏州92.415%(0.902)、杭州95.849%(0.920)。
经过精度评价, 各地区总精度和Kappa 系数都大于0.8, 可见分类精度较高。在光谱特征明显、像元类型较单一的植被覆盖区, 2种方法均能取得较好的分类效果; 而在边界存在混合像元的耕地和建筑、耕地和裸土、水体与裸土的混杂区都有漏分、错分的情况。长江三角洲的3大城市的分类精度要高于蒸水河流域, 其中1个主要原因是因为它们均处于沿海改革开放区, 也是我国的经济发达区, 土地利用紧凑度要高于处于中部农村地区的蒸水河流域, 地表破碎度相对较低, 混杂现象不甚明显。
1)南方丘陵地区由于地势起伏、地物相互混杂、反射光谱互相影响, 使得利用经典方法获取训练样本的监督分类精度不高。本文通过分析混杂于不同背景下的同种地物光谱特征的变化, 在监督分类基础上研建了采用决策树分类法的混杂地物识别模型, 利用遥感影像地物内部光谱值差异和纹理等特征信息对影像进一步分类, 减少了“ 同物异谱” 、“ 同谱异物” 现象对分类精度的影响, 取得了较高的分类精度。
2)对1个流域和3大城市的分类实验结果表明, 在地表形态和地物类型相对复杂的蒸水河流域, 本文模型可以得到较好的分类精度(88.21%), 高于传统采样方法的监督分类精度(79.68%); 而对地表地物混杂度相对简单的长江三角洲3大城市的分类精度在92%以上。
3)应当指出, 本文对一些较容易混淆的地物还是没有达到很高的分类精度, 例如耕地与林地虽然混分情况有所降低, 但仍有进一步提高分类精度的空间。以往的监督分类方法大多偏重于对方法理论模型的研究, 较少针对特定形态地区的地物分布特征, 开展简单、实用、高效的一般性模型方法研究与开发。本文针对南方丘陵地区地物破碎复杂、实现高精度分类难度大的特点, 提出了对混杂在不同背景下的同种地物实现单独分类提取, 取得了分类精度较好、效率较高的效果。本研究可为我国南方典型丘陵地区的地物分类提供参考模型。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|