基于遥感和多源地理数据的城市土地利用分类
Urban land use classification based on remote sensing and multi-source geographic data
通讯作者: 李晓燕(1975-),女,教授,主要研究方向为资源遥感与土地信息系统研究。Email:lxyan@mails.jlu.edu.cn。
责任编辑: 李瑜
收稿日期: 2021-03-5 修回日期: 2021-08-13
基金资助: |
|
Received: 2021-03-5 Revised: 2021-08-13
作者简介 About authors
吴琳琳(1998-),女,硕士研究生,主要研究方向为资源遥感与土地信息系统研究。Email:
城市土地利用信息体现了城市的功能及结构,开展城市土地利用分类研究对于城市可持续发展具有重要指导意义。以哈尔滨市主城区为研究区,综合应用Sentinel-2A遥感影像、OpenStreetMap(OSM)数据、兴趣点(point of interest,POI)数据和珞珈一号夜间灯光数据等多源地理数据,采用面向对象和随机森林算法对哈尔滨城市土地利用进行分类。结果表明: 一级地类总体精度为86.0%,Kappa系数为0.75; 二级地类总体精度为73.9%,Kappa系数为0.69; POI数据可以显著提高住宅用地、工矿仓储用地和教育用地分类精度,夜间灯光数据能有效提高商务办公用地及商业用地分类精度。说明遥感影像与多源地理数据结合对城市土地利用分类有效。
关键词:
Urban land use (ULU) reflects urban functions and structures, and the study of ULU classification can provide guidance for the sustainable development of cities. This study conducted the ULU classification of the main urban area of Harbin City using the object-oriented and random forest methods by integrating multi-source geospatial data including Sentinel-2A remote sensing images, OpenStreetMap (OSM) data, point of interest (POI) data, and nighttime light data from the Luojia-1 satellite. The results are as follows. The overall accuracy of the first-level land use type was 86.0%, with a Kappa coefficient of 0.75. The overall accuracy of the second-level land use types was 73.9%, with a Kappa coefficient of 0.69. The introduction of POI data can significantly improve the classification accuracy of residential land, industrial and mining storage land, and educational land. Meanwhile, night light data can effectively improve the classification accuracy of commercial office land and business land. This study shows that the combination of remote sensing images with multi-source geographic data is effective for ULU classification.
Keywords:
本文引用格式
吴琳琳, 李晓燕, 毛德华, 王宗明.
WU Linlin, LI Xiaoyan, MAO Dehua, WANG Zongming.
0 引言
城市土地利用信息反映着社会经济功能和活动,是城市规划和区域管理的重要基础[1,2],对于解决城市问题、科学合理的发展城市具有重要意义[3,4,5]。因此,准确、详细的城市土地利用信息对城市规划和发展起到关键性作用[6,7,8]。然而,城市土地利用类型复杂多样,人工进行实地调查费时费力,获取详细的城市土地利用信息较为困难[9,10]。国内外学者基于遥感影像获取城市土地利用信息展开了丰富的研究。Gong等[11]利用随机分类方法对中国332个地级市进行城市土地利用分类研究; Zong等[12]基于多源数据,采用随机森林算法对兰州市城市土地利用进行分类并分析不同特征组合对分类结果的影响; Zeferino等[13]利用Landsat8卫星影像研究环境数据对土地利用的影响; Saboori等[14]利用高分辨率影像多尺度的纹理特征与神经网络算法相结合,对城市土地利用信息进行提取。
随着城市化的不断发展,快速高效获取城市土地利用信息成为研究热点。随机森林是一种新型的集成算法,具有训练样本数量少、人工干预少,精度较高、不易过拟合的特点,相较于其他传统方法具有很好的鲁棒性[15,16]。目前,随机森林已广泛运用到遥感影像分类中。周天宁等[17]基于Landsat TM影像,利用随机森林优化算法对昌平区进行土地利用分类,其结果验证了随机森林在土地利用分类的稳定性; 马玥等[18]基于随机森林算法,对齐齐哈尔市周边的农业耕种区进行土地利用分类研究,实现了分类效率、精度及适用性之间的平衡,为农业耕种提供参考; 杨耘等[19]利用高分辨率影像提取城市土地利用分类,通过多个算法对比发现随机森林算法对城市土地利用类型提取效果较好,可以为城市土地利用分类提供准确的依据。
哈尔滨市为黑龙江省省会城市,是中国15座副省级城市之一。哈尔滨地处中国东北地区,是东北北部的政治、经济、文化中心。哈尔滨市城市用地类型较多,获取困难,研究哈尔滨城市土地利用分类对促进城市发展和解决城市问题具有重要意义。选择哈尔滨城市用地为研究区,分析多源地理空间数据对城市土地利用类型的提取能力,利用多尺度分割和随机森林算法对哈尔滨市城市用地进行分类,为城市规划及管理提供依据。
1 研究区概况与数据源
1.1 研究区概况
哈尔滨市(图1)位于东北平原,地处E125°42'~130°10',N44°04'~46°40'之间。哈尔滨市总面积为5.31×104 km2,其中,建成区面积为302.41 km2; 截至2019年,全市常住人口为1 076.3万人,城镇人口709.3万人,城镇化率65.9%。哈尔滨市东部与牡丹江市相连,南部与长春市、吉林市接壤,西部与绥化市、大庆市相连,北部与伊春市接壤。哈尔滨市不仅是黑龙江省省会城市,同时也是东北亚中心地带。本文选取哈尔滨市环城高速路内为研究区。
图1
1.2 数据源
1.2.1 Sentinel-2A遥感数据
研究所需的影像数据从Google Earth Engine平台下载(
1.2.2 OSM路网数据
图2
1.2.3 采样地块数据
表1 采样地块类型及数量
Tab.1
一级地类用地类型 | 二级地类用地类型 | 二级地 类编码 | 数量/个 | |
---|---|---|---|---|
训练 样本 | 验证 样本 | |||
住宅用地 | 住宅用地 | 0101 | 37 | 7 |
商服用地 | 商务办公用地 | 0201 | 30 | 5 |
商业用地 | 0202 | 32 | 6 | |
工矿仓储用地 | 工矿仓储用地 | 0301 | 30 | 7 |
交通运输用地 | 交通运输用地 | 0401 | 31 | 6 |
公共管理与公共服务用地 | 机关团体用地 | 0501 | 30 | 7 |
教育用地 | 0502 | 35 | 8 | |
医疗卫生用地 | 0503 | 32 | 6 | |
体育和文化设施用地 | 0504 | 30 | 5 | |
公园与绿地 | 0505 | 31 | 8 | |
总计 | 318 | 66 |
1.2.4 POI数据
表2 POI城市基本土地利用分类体系
Tab.2
POI类型 | 二级地类用地类型 | 数量/个 | 比例/% |
---|---|---|---|
商务住宅 | 住宅用地 | 634 | 13.44 |
金融服务 | 商务办公用地 | 508 | 10.77 |
餐饮、购物、住宿服务 | 商业用地 | 548 | 11.62 |
工厂、机械电子、冶金化工 | 工矿仓储用地 | 432 | 9.16 |
车站、机场 | 交通运输用地 | 385 | 8.16 |
政府办公 | 机关团体用地 | 459 | 9.73 |
科教服务 | 教育用地 | 425 | 9.01 |
医疗保健用地 | 医疗卫生用地 | 473 | 10.03 |
体育、文化服务 | 体育和文化设施用地 | 385 | 8.16 |
风景 | 公园与绿地 | 468 | 9.92 |
1.2.5 夜间灯光数据
2 研究方法
图3为研究中使用的主要方法: ①用OSM获取的路网数据生成城市地块; ②对Sentinel-2A数据、POI数据和夜间灯光数据进行特征提取; ③通过Google Earth和实地测量采集训练样本和验证样本; ④进行哈尔滨市制图和分类精度评估,分析不同特征组合对分类结果的影响。
图3
2.1 多尺度分割方法
式中: var为遥感影像的局部方差; x为影像对象的灰度值;
图4
2.2 特征提取
表3是对数据提取的特征,分别对光谱、纹理、POI数据、珞珈一号夜间灯光数据进行特征提取。根据Sentinel-2A波段和典型光谱指数计算光谱特征; 通过灰度共生矩阵计算纹理特征; 计算POI总数、二级地类POI个数及比例; 计算夜间灯光数据的像元亮度DN平均值和DN总和。
表3 地块特征汇总
Tab.3
特征信息 | 特征系数 |
---|---|
光谱 | 红光、绿光、蓝光、近红外波段的平均值、标准差、标准偏差、均方差、纹理平均值、NDVI和NDBI |
纹理 | 红光、绿光、蓝光、近红外波段的均值、标准差、同质性、异质性、熵 |
POI数据 | POI总数、二级地类POI个数、不同二级地类POI比例 |
夜间灯光数据 | DN平均值和DN总和 |
2.3 随机森林分类方法
随机森林是2001年由Breiman提出的一种机器学习算法,结合Bagging集成学习理论和随机子空间的方法,由多颗决策树分类器构成[30]。随机森林的训练流程如图5所示。首先,通过随机重采样的方式从原始训练样本中有放回的随机抽取N个训练集,每个训练集数量约为原始数据集的2/3; 其次,将每个训练集建立分类决策树,产生N棵CART决策树组成的森林。根据基尼系数最小原则选出最优内部节点分支; 最后,采用集成学习理论将N棵决策树的预测结果进行统计,通过投票结果判定未分类样本的类别,分类结果由多数决策树投票结果决定。在抽取样本时约有1/3的数据没有抽中,利用这1/3的数据进行内部误差估计,产生袋外(out-of-bag)数据误差。
图5
本研究以地块为分类单元,随机森林算法通过eCognition Developer 9平台实现。通过实验得出,当N≥100时,各个地物类型的袋外误差趋于稳定。
2.4 精度评价指标
利用验证样本对随机森林分类精度进行验证,采用混淆矩阵对城市土地利用分类精度进行评价。评价指标包括生产者精度、用户精度、总体精度及Kappa系数,表达式分别为:
式中: PA为生产者精度; Pjj为类型中第j类和实测数据类型第j类所占的组成成分; P+j为实际观测的第j类的总和; UA为用户精度; Pii为类型中第i类和实测数据类型第i类所占的组成成分; Pi+为分类得到的第i类总和; OA为总体精度; Pk1,Pk2,…,Pkn为实测数据类型中第k类所占的组成成分; P为总样本数; P+i为实际观测的第i类的总和。
3 结果与分析
3.1 精度验证
表4为一级地类精度的混淆矩阵,利用总体精度和Kappa系数来判定地类精度。一级地类总体精度为86.0%,Kappa系数为0.75; 二级地类总体精度为73.9%,Kappa系数为0.69。其中,商业用地用户者精度为95.1%,公园与绿地用户者精度为97.1%; 机关团体用地和医疗卫生用地分类精度较低,前者用户者精度为15.7%,后者用户者精度为11.1%。
表4 一级地类精度混淆矩阵
Tab.4
用地类型 | 住宅用地 | 商服用地 | 工矿仓储用地 | 交通运输用地 | 公共管理与公 共服务用地 | 用户精度/% |
---|---|---|---|---|---|---|
住宅用地 | 3 573 | 157 | 1 747 | 0 | 5 092 | 33.8 |
商服用地 | 0 | 10 329 | 0 | 0 | 804 | 92.7 |
工矿仓储用地 | 0 | 0 | 10 184 | 0 | 104 | 98.9 |
交通运输用地 | 468 | 0 | 382 | 669 | 0 | 44.0 |
公共管理与公共服务用地 | 809 | 570 | 976 | 792 | 48 446 | 93.9 |
生产者精度/% | 73.6 | 93.4 | 76.6 | 45.7 | 60.6 | |
总体精度/% | 86.0 | |||||
Kappa系数 | 0.75 |
3.2 城市土地利用分类结果
通过OSM数据对哈尔滨市路网数据进行提取,利用多尺度分割将Sentinel-2A遥感卫星影像分割为地块。对POI数据进行筛选和重分类,将夜间灯光数据进行特征提取,利用随机森林分类方法对研究区进行分类,结果如图6所示。
图6
3.3 不同特征组合的分类精度分析
图7为二级地类在不同特征组合下参与土地利用分类的生产者精度及用户精度。可以看出,不同数据组合参与土地利用分类的精度不同。当采样地块参与土地利用分类时,公园与绿地的生产者精度和用户精度最高,分别为95.5%和64.6%。相比加入POI数据和夜间灯光数据后精度的提高并不显著。说明对公园与绿地的识别主要依赖于遥感光谱特征和纹理特征。图7中,与(a)相比,(b)和(c)中商务办公用地和商业用地精度显著提高,但夜间灯光数据对商服用地精度的提升幅度更大; (b)中教育用地的精度高于(a)中的精度,说明POI数据可以提高教育用地的精度,其生产者精度为71.4%,用户精度为62.5%; (c)中夜间灯光数据对住宅用地的分类精度略有提高,但没有(b)中提高幅度大,表明POI数据可以改善对住宅用地分类精度,但程度有限; (a)中工矿仓储用地精度较低,(b)中工矿仓储用地精度有显著提高,说明工矿仓储用地更适合用POI数据参与分类。在所有试验中,机关团体用地和医疗卫生用地精度均较低,POI数据和夜间灯光数据对机关团体用地和医疗卫生用地精度提升改善程度有限。同(a)相比,(b)中体育和文化设施用地精度有所提升,说明POI数据可以提高体育和文化设施用地的精度,但是并未达到良好效果。遥感影像数据的光谱特征、纹理特征、POI数据和夜间灯光数据可以有效提高城市土地利用分类精度。单独使用采样地块数据参与分类时,城市土地利用分类精度较低; 当使用采样地块和POI数据时,可以较好地提高住宅用地、工矿仓储用地和教育用地精度; 当使用采样地块和夜间灯光数据时,对商务办公用地和商业用地精度提升较大; 将全部特征参与分类时,分类结果的精度最高,即为分类的最佳组合。这表明综合使用多源特征可以改善城市土地利用分类的精度,光谱特征、纹理特征、POI数据和夜间灯光数据可以显著提升某些地块类型的准确性,但是综合运用可以有效提升所有地物类型的准确性。
图7
图7
基于不同特征组合的生产者精度和用户精度(二级地类)
Fig.7
Producer accuracy and user accuracy of different features combinations (LevelⅡcategory)
4 结论与讨论
本文以哈尔滨市市区为研究区,结合OSM数据将地块划分为基本分类单元,基于Sentinel-2A遥感影像、POI数据和夜间灯光数据等,采用随机森林分类方法对研究区进行城市土地信息提取,得到如下结论:
1)一级地类总体分类精度为86.0%,Kappa系数为0.75; 二级地类总体精度为73.9%,Kappa系数为0.69。
2)遥感影像、多源地理空间数据及网络数据相结合能够有效提高分类精度,有利于提高城市土地利用分类效果。
3)POI数据可以显著提高住宅用地、工矿仓储用地和教育用地分类精度; 夜间灯光数据能够有效提高商务办公用地及商业用地分类精度。
相较于2018年中国基本城市土地利用分类,本文分类精度有较高的提升。文章选取训练样本的混合度更低,提高了训练样本的纯度和数量; 利用更详细的路网数据对地块进行分割,并且选取训练样本数据时尽可能在空间分布上均匀分布。尽管上述方法对于研究区能够得到较好的分类结果,同时也存在局限性。城市土地内部结构复杂多样,实际土地利用大多为混合地块,无法精确保证每个地块均为单一类型。同时城市的快速发展使城市三维空间利用率增加,一幢建筑中不同高度的建筑用地不是单一用地类型,仅用路网数据很难对其进行精确有效的划分。POI数据和夜间灯光数据可以有效提高分类精度,但是并不适合所有用地类型,造成城市土地利用分类精度差异性。在对城市土地利用类型进行分类过程中,应更进一步对地块进行精准划分,路网数据可以有效对地块进行划分,但是并不能完全将不同类型的地块划分出来。要进一步优化地块分割的过程,尽量减少有多种土地利用类型的地块,根据不同土地利用类型的特征使用不同尺度参数的分割。此外,对于具有多种利用类型的地块,根据不同高度或面积来有针对性地权衡POI数据对分类结果的影响,尽可能将不同土地利用类型进行细化区分。
(责任编辑: 李瑜)
参考文献
Measuring functional urban shrinkage with multi-source geospatial big data:A case study of the Beijing-Tianjin-Hebei megaregion
[J].DOI:10.3390/rs12162513 URL [本文引用: 1]
Comparison of machine-learning metho-ds for urban land-use mapping in Hangzhou City,China
[J].DOI:10.3390/rs12172817 URL [本文引用: 1]
Mapping the essential urban land use in Changchun by applying random forest and multi-source geospatial data
[J].DOI:10.3390/rs12152488 URL [本文引用: 1]
An object-based convolutional neural network (OCNN) for urban land use classification
[J].DOI:10.1016/j.rse.2018.06.034 URL [本文引用: 1]
Joint deep learning for land cover and land use classification
[J].
DOI:10.1016/j.rse.2018.11.014
[本文引用: 1]
Land cover (LC) and land use (LU) have commonly been classified separately from remotely sensed imagery, without considering the intrinsically hierarchical and nested relationships between them. In this paper, for the first time, a highly novel Joint Deep Learning framework is proposed and demonstrated for LC and LU classification. The proposed Joint Deep Learning (JDL) model incorporates a multilayer perceptron (MLP) and convolutional neural network (CNN), and is implemented via a Markov process involving iterative updating. In the JDL, LU classification conducted by the CNN is made conditional upon the LC probabilities predicted by the MLP. In turn, those LU probabilities together with the original imagery are re-used as inputs to the MLP to strengthen the spatial and spectral feature representations. This process of updating the MLP and CNN forms a joint distribution, where both LC and LU are classified simultaneously through iteration. The proposed JDL method provides a general framework within which the pixel-based MLP and the patch-based CNN provide mutually complementary information to each other, such that both are refined in the classification process through iteration. Given the well-known complexities associated with the classification of very fine spatial resolution (VFSR) imagery, the effectiveness of the proposed JDL was tested on aerial photography of two large urban and suburban areas in Great Britain (Southampton and Manchester). The JDL consistently demonstrated greatly increased accuracies with increasing iteration, not only for the LU classification, but for both the LC and LU classifications, achieving by far the greatest accuracies for each at around 10 iterations. The average overall classification accuracies were 90.18% for LC and 87.92% for LU for the two study sites, far higher than the initial accuracies and consistently outperforming benchmark comparators (three each for LC and LU classification). This research, thus, represents the first attempt to unify the remote sensing classification of LC (state; what is there?) and LU (function; what is going on there?), where previously each had been considered separately only. It, thus, has the potential to transform the way that LC and LU classification is undertaken in future. Moreover, it paves the way to address effectively the complex tasks of classifying LC and LU from VFSR remotely sensed imagery via joint reinforcement, and in an automatic manner.
Mapping urban land use by using Landsat images and open social data
[J].DOI:10.3390/rs8020151 URL [本文引用: 1]
Sampling strategy for detailed urban land use classification:A systematic analysis in Shenzhen
[J].DOI:10.3390/rs12091497 URL [本文引用: 1]
Mapping essential urban land use categories in Nanjing by integrating multi-source big data
[J].DOI:10.3390/rs12152386 URL [本文引用: 1]
The exploration of urban material anabolism based on RS and GIS methods:A case study in Jinchang,China
[J].DOI:10.3390/rs12030370 URL [本文引用: 1]
Spatiotemporal analysis of land use/cover patterns and their relationship with land surface temperature in Nanjing,China
[J].DOI:10.3390/rs12030440 URL [本文引用: 1]
Mapping essential urban land use categories in China (EULUC-China):Preliminary results for 2018
[J].DOI:10.1016/j.scib.2019.12.007 URL [本文引用: 2]
Detailed mapping of urban land use based on multi-source data:A case study of Lanzhou
[J].DOI:10.3390/rs12121987 URL [本文引用: 1]
Does environmental data increase the accuracy of land use and land cover classification?
[J].
Combining multi-scale textural features from the panchromatic bands of high spatial resolution images with ANN and MLC classification algorithms to extract urban land uses
[J].DOI:10.1080/01431161.2019.1620371 URL [本文引用: 1]
Regional mapping of essential urban land use categories in China:A segmentation-based approach
[J].DOI:10.3390/rs12071058 URL [本文引用: 1]
Landscape patterns and building functions for urban land-use classification from remote sensing images at the block level:A case study of Wuchang district,Wuhan,China
[J].DOI:10.3390/rs12111831 URL [本文引用: 1]
参数优化随机森林算法的土地覆盖分类
[J].
Land cover classification based on parameter optimization random forest algorithm
[J].
基于随机森林算法的农耕区土地利用分类研究
[J].
Research on land use classification of farming areas based on random forest algorithm
[J].
条件随机场框架下基于随机森林的城市土地利用/覆盖遥感分类
[J].DOI:10.6046/gtzyyg.2014.04.09 [本文引用: 1]
Urban land use/cover remote sensing classification based on random forest under conditional random field framework
[J].DOI:10.6046/gtzyyg.2014.04.09 [本文引用: 1]
基于兴趣点(POI)大数据的东北城市空间结构分析
[J].
DOI:10.13249/j.cnki.sgs.2020.05.003
[本文引用: 1]
以东北三省36个城市为研究区,利用 400余万条兴趣点行业分类大数据,采用核密度估计、标准差椭圆、区位熵等方法分析城市空间结构及其行业构成机制。研究发现,东北城市要素显著集聚,城市内部空间结构呈现集中团块型、分散组合型、线型、放射型特征以及多元复合类型;第二产业和房地产业呈现郊区化特征,各行业发展方向与东北大区域的经济轴线一致,多数行业尚未形成专业化功能区;第二产业与房地产业的离心发展对集中团块型城市的塑造作用不强,但对分散组合型城市空间结构的贡献较大。线型城市通常兼具多中心特征,放射型城市各行业仍偏向于向心聚集。
Spatial structure analysis of northeast cities based on big data of point of interest (POI)
[J].
基于POI要素空间聚集特征的城市多中心结构识别——以郑州市为例
[J].
Urban multi-center structure recognition based on the spatial aggregation characteristics of POI elements:Taking Zhengzhou as an example
[J].
A new method for the assessment of spatial accuracy and completeness of OpenStreetMap building footprints
[J].DOI:10.3390/ijgi7080289 URL [本文引用: 1]
数据清洗在构建POI数据仓库中的研究与应用
[D].
夜间灯光遥感数据应用综述和展望
[J].
DOI:10.18306/dlkxjz.2019.02.005
[本文引用: 1]
在遥感应用研究中,夜间灯光遥感作为发展活跃的一个重要分支,近年来受到越来越多来自自然科学领域和社会经济领域的关注。与传统的光学遥感卫星获取地物辐射信息不同,夜间灯光遥感是获取夜间无云条件下地表发射的可见光-近红外电磁波信息。相比于普通的遥感卫星影像,夜间灯光遥感所使用的夜间灯光影像记录的地表灯光强度信息更直接反映人类活动差异,因而被广泛应用于城市化进程研究、不透水面提取、社会经济指标空间化估算、重大事件评估、生态环境评估等领域。目前,虽然基于夜间灯光数据的应用研究成果正在不断积累,但对成果的系统性总结、整理的研究目前存在着覆盖面不全、时效性不强等不足。基于此,论文通过对近几十年来有关夜间灯光数据的研究成果的详细梳理,从数据处理与技术方法、应用研究等方面进行归纳总结。最后,文章从多源数据融合、应用领域拓展和短周期地表灯光监测3个方面指出了未来的研究热点。
Summary and prospect of the application of nighttime light remote sensing data
[J].
基于夜间灯光影像的珞珈一号指数分析
[J].
Analysis of Luojia-1 index based on nighttime light image
[J].
成都平原高分辨率遥感影像分割尺度研究
[J].DOI:10.6046/gtzyyg.2010.02.02 [本文引用: 1]
Research on the segmentation scale of high-resolution remote sensing image of Chengdu Plain
[J].DOI:10.6046/gtzyyg.2010.02.02 [本文引用: 1]
高分辨率遥感影像多尺度分割中最优尺度选取方法综述
[J].
A review of optimal scale selection methods in multi-scale segmentation of high-resolution remote sensing images
[J].
基于面向对象分类方法的城市用地类型提取
[J].
Urban land type extraction based on object-oriented classification method
[J].
The factor of scale in remote sensing
[J].DOI:10.1016/0034-4257(87)90015-0 URL [本文引用: 1]
/
〈 |
|
〉 |
