基于多元数据的省会城市城中村精细提取
Fine extraction of urban villages in provincial capitals based on multivariate data
通讯作者: 张志华(1980-),男,博士,教授,研究方向为三维地学模拟、摄影测量与图像识别。Email:43447077@qq.com。
责任编辑: 张仙
收稿日期: 2020-11-23 修回日期: 2021-03-20
基金资助: |
|
Received: 2020-11-23 Revised: 2021-03-20
作者简介 About authors
冯东东(1995-),男,硕士研究生,研究方向为影像提取与分析。Email:
城中村是指农村耕地被收走后,剩余宅基地被城市包围的农村聚落。针对当前城中村的研究缺少数据支撑和定量分析等问题,基于高分辨率遥感影像、建筑物轮廓及兴趣点(point of interest,POI)等多元空间数据,以广东省省会广州市的主城区为研究区域,利用ENVI中深度学习工具提取城中村边界,其城中村正确识别率为64.31%。对于提取结果中存在与部分老旧居民区、工业区混淆的现象,进一步使用路网分割高分辨率遥感影像,制作城中村标签数据。结合机器学习分类方法,使用支持向量机分类器提取城中村轮廓。该方法提取的精度可达到90.19%,对于研究区内城中村改造、城市规划设计等具有一定的参考意义。
关键词:
Urban villages refer to the rural settlements where the homesteads are surrounded by cities after the farmland in the settlements is expropriated. Given the lack of data support and quantitative analyses in the current researches on urban villages, this study aims to extract the boundaries of urban villages using the deep learning tools in ENVI based on multiple spatial data such as high-resolution remote sensing images, building outlines, and points of interest (POI). The study area is the main urban area of Guangzhou City-the capital of Guangdong Province, for which the initial correct recognition rate of urban villages was 64.31%. To overcome the confusion between the urban villages and some old residential areas and industrial areas in the extraction results, high-resolution remote sensing images were further segmented using the road network to produce label data of urban villages. Then the outlines of the urban villages in the city were extracted using a support vector machine classifier based on machine learning classification algorithms, obtaining precision of up to 90.19%. Therefore, this study can serve as a reference for the reconstruction of urban villages and urban planning and design in the study area to some extent.
Keywords:
本文引用格式
冯东东, 张志华, 石浩月.
FENG Dongdong, ZHANG Zhihua, SHI Haoyue.
0 引言
改造城中村不但能够保证村内居民生产生活需要,而且可有效集约土地,提升城市美观性与协调性[1]。目前有关城中村的研究主要集中在理论和政策层面,易受时空因素制约,缺少数据支撑及定量分析。因此如何从城市结构中精细提取出城中村区域,逐渐成为学者们研究的热点。
近年来有学者提出利用遥感影像提取城中村,例如刘辉[1]基于深度神经网络模型和场景语义描述的方法,以深圳和武汉为例提取城中村; Boutell等[2]将地物场景分割为一定数量的子块,然后计算每个子块的光谱特征,最后根据子块特征,使用支持向量机算法实现地物的分类。此外,还有学者提出基于面向对象的城中村提取方法,例如尚春艳[3]利用传统的面向对象法对研究区的城中村土地利用进行检测,并提取变化信息; Li等[4]利用高分辨率影像,以非监督深度学习为基础,建立了多种分割模型,对深圳市城中村进行提取。然而,由于城中村内房屋建筑复杂,特征不一,常用的分割算法难以准确分割出城中村与相邻地物对象,因此面向像元和对象的提取方法难以有效应用于城中村提取。
鉴于此,本文结合多元空间数据,利用遥感影像提取技术与地理信息系统(geographic information system,GIS)空间分析技术相结合的方法对城中村进行提取; 并通过对广州市主城区的城中村进行定量空间分析,总结出城中村的分布特征,从而为解决城中村改造等问题提供数据支撑和方法参考。
1 研究区概况与数据源
广州市位于广东省中南部,濒临南海,是国家首批沿海开放城市,属珠三角地区和粤港澳大湾区经济中心,截至2019年,广州市人口总数约1 531万人,城镇化率接近90%[5]。选取广州市的4个中心城区(天河区、越秀区、荔湾区和海珠区)作为研究区域,其在广州市的地理位置如图1所示。本项研究数据源主要有: ①广州市高分一号卫星影像数据; ②道路网数据,由开源地图OpenStreetMap (OSM)提供; ③建筑物轮廓数据,研究区共计101 453栋建筑物轮廓面数据,其中包含建筑物矢量边界信息及楼层高度和面积属性信息; ④兴趣点(point of interest,POI)数据,研究区共计545 812个点数据,共3大类,18种具体类型。
图1
2 研究方法
本文从提取研究区城中村的角度出发,结合了互联网POI数据、高分辨率遥感影像数据以及建筑物轮廓数据等,实现对研究区城中村提取。首先对原始数据进行空间分析和处理,构造出城中村地块特征属性,然后对包含特征属性的城中村地块数据进行分类,得到提取结果。本文实验的主要实验流程如图2所示。
图2
2.1 基于ENVI深度学习的城中村信息提取
1)影像预处理。主要包括影像的辐射定标、大气校正、几何纠正及波段融合等过程。
2)创建标签图像。通过裁剪影像子集,绘制标签数据,并使用模块工具生成标签图像(label raster)。标签数据需要选择具有代表性的典型区域进行样本采集。
3)训练模型。利用感兴趣区和标签图像初始化一个新的模型,并在模块中设置训练参数,对模型进行训练。
4)执行分类。使用模块提供的工具对图像进行分类,该工具会生成一幅类激活图像(class activation map,CAM)。CAM是一个灰度图像,其像元值表示属于提取目标的概率。对CAM图像进行分类后处理,可直观表示出城中村提取结果。
2.2 融合多元数据的城中村识别
由于单方面利用遥感影像提取出的城中村信息存在与老城区、工业厂房等混淆的问题,因此需要进一步的精细提取。城中村其明显的特征为房屋不高且密集,本文通过统计建筑物高度面积等属性信息,再结合高分辨率遥感影像的光谱特征,以及各类POI核密度属性实现对城中村信息的提取。
以详尽的道路网络划分出的区域作为城中村基本地块单元,根据地块单元的矢量图斑,分割研究区高分辨率影像,计算每个地块单元中影像各波段的均值及亮度值,融合建筑物、POI等空间信息构建地块单元特征集合。详细步骤如下:
1)在eCognition中对高分一号影像进行分割,通过计算得到研究区地块单元的光谱属性信息,存入对应的地块单元矢量图斑下[8]。实现以地块图斑为基本单元,将影像分割成地块影像单元集合,并为每个影像单元赋予唯一的编号ID,便于索引。
2)原始建筑物轮廓数据包含楼层高度信息,利用ArcGIS计算出建筑物面积值,再将地块单元矢量数据与建筑物数据进行空间关联,从而统计出每个地块单元内建筑物的高度、面积等属性信息[9]。通过计算每个地块单元内建筑物的平均高度、高度标准差、建筑物面积总和以及平均建筑面积信息,作为建筑物属性值。
式中: SD为要素之间的标准距离; Dm为要素之间的中值距离; n为没有使用 population 字段的点数,如果提供population字段,则n是population字段值的总和,其中,population字段是指在核密度分析过程中,计算目标位置时的样本个数。
结合研究区城市POI类型及特点,选取不同的核密度参数得到实验结果,其中住宅用地POI核密度搜索半径(带宽)值设为1 500 m,公共服务用地POI核密度搜索半径值为3 000 m,而商业服务用地2 000 m。得到各类POI的核密度栅格图后,利用ArcGIS的分区统计工具和属性表连接功能,将各类POI的核密度栅格值连接到之前的地块单元矢量数据中。可在ArcGIS中查看构建的研究区地块单元矢量图斑属性表,其中包含地块ID、地块类别、地块光谱特征属性、建筑物特征属性及各类POI特征属性。
表1 构建的地块单元特征
Tab.1
特征类型 | 对象属性名称 | 属性描述 |
---|---|---|
光谱特征 | Mean | 共3类属性值,为地块内1,2,3波段的亮度平均值 |
Brightness | 地块内3个波段的亮度加权平均值 | |
建筑物特征 | Area Floor SUM_Area AVG_Area AVG_Floor SD_Floor | 地块内建筑物面积 地块内建筑物高度 地块内建筑物面积总和 地块内建筑物面积的平均值 地块内建筑物高度的平均值 地块内建筑物高度的标准差 |
POI特征 | POI_Mean | 共3类属性值,为地块内各类POI的核密度栅格均值 |
式中: i为样本集序号; x,y和b均为列向量; w为支持向量对应的样本点到决策面的距离向量。
两类样本最大的分类间隔为2/
式中: Φ(w)为最佳参数是w时目标函数的值;
为了便于求解,构造出Lagrange函数,即
式中: i为样本集下标,i=1,2,…,l; ai为Lagrange系数,对w和b求偏微分得:
将式(2),(5)和(6)作为约束条件,就将原始问题转成求解二次规划时的对偶性问题,可得出:
式(7)是一个二次函数,在式(8)约束下存在唯一最优解。若
3 实验结果与分析
3.1 ENVI深度学习的城中村提取结果
本文选取天河区为样本集,首先绘制城中村标签数据[15],共105个及背景地物321个,共计样本总数426个,其中包含输入图像的原始波段和掩模波段,掩模波段中DN值为1的像元代表目标,0代表背景。然后利用感兴趣区和标签图像初始化一个新模型,在Train TensorFlow Mask Model中设置训练参数,经多次试验,选取参数模型如下: Patch Size值为316,Epochs值为20,Class Weight值为0~2,Loss Weight值为1,Solid Distance值为1,Blur Distance值为0~2。最后使用训练模型对影像分类,其结果会产生一幅CAM图像,该灰度图像的像元值表示属于提取目标的概率,图像中高亮显示部分即与目标特征的匹配度较高,如图3所示。对CAM图像进行密度分割,使其按照不同颜色进行显示,如图4所示。
图3
图4
图5
3.2 提取精度评价
精度高低可通过Loss和F1的值来评价,在ENVI深度学习模块下查看训练模型精度参数,绘制精度参数折线图,如图6所示。
图6
通过图6可知,随迭代次数增加,模型的损失值Loss降低,精度F1值上升,表明深度学习工具可以较好地训练提取模型,实现对城中村的提取,共计识别出城中村423个,发现有272个被正确识别,正确识别率为64.31%。
3.3 基于多元数据的城中村识别结果
原始的OSM数据存在缺失与拓扑错误,需进行后处理; 然后将道路网络数据转化为面状图斑,最终得到6 718个地块单元,如图7所示。
图7
图8
图8
影像基于矢量分割结果
Fig.8
Image segmentation is based on vector segmentation results
将分割出的矢量图层与上文利用ENVI Deep Learning提取出的轮廓信息进行叠加,并为各地块对象添加城中村与非城中村的属性值,最后进行修正统计,制作一份完整的标签数据。
表2 选择不同特征属性的分类精度
Tab.2
序号 | 特征类型 | 特征子集 | 分类精度/% |
---|---|---|---|
1 | 光谱、建筑物、POI | Mean,Brightness,Area,Floor,SUM_Area,AVG_Area,AVG_Floor,SD_Floor,POI_Mean | 90.193 6 |
2 | 光谱、建筑物 | Mean,Brightness,Area,Floor,SUM_Area,AVG_Area,AVG_Floor,SD_Floor | 84.652 5 |
3 | 光谱、POI | Mean,Brightness,POI_Mean | 77.620 8 |
4 | 建筑物、POI | Area,Floor,SUM_Area,AVG_Area,AVG_Floor,SD_Floor,POI_Mean | 69.899 0 |
5 | 光谱 | Mean,Brightness | 65.659 7 |
图9
图10
图10
在Google Earth上显示识别结果
Fig.10
Display the recognition results in Google Earth
城中村的错分对象主要为老旧居民区和工业区。三者之间共同特征为绿化率低、楼层较矮,当单个面积较小的建筑物所占该地块总比例较高时,三者在影像上表现出的特征极为相似,所以LIBSVM分类器很容易误判。
海珠区中城中村数量最多、密度最大; 其次是天河区、荔湾区; 最后是越秀区,越秀区为中心商业区,城中村改造完成度高; 整体而言,研究区城中村分布较为分散,分布在整个城市区域中。
4 结论
针对目前城中村研究缺少数据支撑和定量分析等问题,将遥感影像提取技术与GIS空间分析技术相结合,提出基于深度学习工具提取城中村和基于多元空间数据识别城中村地块的方法。实验结果表明,利用深度学习工具,能够较好地提取出城中村边界信息。基于路网分割高分辨率遥感影像,结合机器学习分类方法识别城市不同地块单元,对城中村可精细提取,分类精度高达90%。
本文基于多元数据对城中村提取进行了研究,但提取结果仍存在一定的偏差,进一步研究的问题主要包括:
1)在融合多元空间数据辅助提取城中村时,可考虑添加Sentinel卫星数据,表示出地物的空间高度信息,用于区分城中村建筑和平整的运动场等地物。
2)因训练模型耗时较长,且模型训中存在一定的随机性,对于高分辨率遥感影像复杂的地物环境,提取结果仍存在与老旧居民区、工业区混合现象,可考虑进一步优化模型参数,提升提取效率及精度。
参考文献
基于高分辨率遥感影像的城中村提取方法研究
[D].
Study on extraction method of urban villages based on high-resolution remote sensing image
[D].
Scene parsing using region-based generative models
[J].DOI:10.1109/TMM.2006.886372 URL [本文引用: 1]
基于高分辨率影像的城中村土地利用变化检测
[D].
Detection of land use change in urban villages based on high resolution images:A case study of Chang’an District,Xi’an City
[D].
Unsupervised deep feature learning for urban village detection from high-resolution remote sensing images
[J].
Investigating urbanization and its spatial determinants in the central districts of Guangzhou,China
[J].DOI:10.1016/j.habitatint.2015.10.013 URL [本文引用: 1]
基于ENVI深度学习模型的卫星影像识别方法研究
[J].
Research on satellite image recognition method based on ENVI deep learning model
[J].
基于Canny算法的面向对象影像分割
[J].DOI:10.6046/gtzyyg.2011.04.05 [本文引用: 1]
Object-oriented image segmentation based on Canny algorithm
[J].DOI:10.6046/gtzyyg.2011.04.05 [本文引用: 1]
基于卷积神经网络的高分辨率遥感影像建筑物提取
[D].
Building extraction of high-resolution remote sensing image based on convolutional neural network
[D].
Spatial patterns of retail stores using POIs data in Zhengzhou,China
[C]//
Urban nighttime leisure space mapping with nighttime light images and POI data
[J].DOI:10.3390/rs12030541 URL [本文引用: 1]
核密度估计法支持下的网络空间POI点可视化与分析
[J].
The visualization and analysis of POI features under network space supported by kernel density estimation
[J].
Remote sensing image classification:A survey of support-vector-machine-based advanced techniques
[J].DOI:10.1109/MGRS.2016.2641240 URL [本文引用: 1]
A novel SOM-SVM-based active learning technique for remote sensing image classification
[J].DOI:10.1109/TGRS.2014.2305516 URL [本文引用: 1]
基于面向对象与深度学习的榆树疏林识别方法研究
[J].
DOI:10.12082/dqxxkx.2019.190598
[本文引用: 1]
榆树疏林是浑善达克沙地中一种特殊的植被类型,它对于维持区域生态系统稳定具有重要意义,在防风固沙、涵养水源、调节气候等方面发挥着重要的作用。本文利用无人机影像与GF-2影像,对高分辨率数据源中榆树疏林的两种自动识别方法进行了研究。在面向对象方法中,首先通过计算影像对象的局部方差变化率得到了最佳分割尺度;其次采用随机森林算法对初选特征的重要性进行排序,并删除无关特征;最后分别对支持向量机(SVM)、随机森林(RF)、深度神经网络(DNN)3种分类器进行参数寻优与榆树疏林提取。此外,在ENVI5.5中基于TensorFlow框架,利用U-Net构建深度学习模型对榆树疏林进行了提取,并与面向对象方法进行对比。结果显示:① 通过面向对象方法过程的优化,最终的识别精度较以往研究有所提升,GF-2影像中SVM总体精度为90.14%,RF总体精度为 90.57%,DNN总体精度为91.14%;无人机影像中SVM总体精度为97.70%, RF与DNN总体精度为97.42%。② 深度学习方法中,GF-2影像的总体精度为91.00%,无人机影像的总体精度达到了98.43%。研究结果说明在榆树疏林提取中,无人机影像具有更高的空间分辨率,更丰富的纹理、形状等信息,能达到比GF-2影像更高的精度。面向对象方法对于2种影像都有较高的适用性;深度学习的方法在本文中更适用于无人机影像,它可以有效地减少无人机影像中的错分现象。
Study on drought and flood evolution in Guangxi based on TRMM data and SPI drought index
[J].
基于DSM点云纠正的正射影像房屋边缘锯齿消除
[J].
Removing aliasing effects of house edge in DOM based on the correction of DSM
[J].
基于DeepLabv3+语义分割模型的GF-2影像城市绿地提取
[J].DOI:10.6046/gtzyyg.2020.02.16 [本文引用: 1]
Urban green space extraction from GF-2 remote sensing image based on DeepLabv3+semantic segmentation model
[J].DOI:10.6046/gtzyyg.2020.02.16 [本文引用: 1]
深度学习方法用于遥感图像处理的研究进展
[J].
Research progress of deep learning method used to remote sensing image processing
[J].
Oblique split technique in septal reconstruction
[J].
DOI:10.1055/s-0033-1360599
PMID:24327247
[本文引用: 1]
The septum is considered to be the most important anatomical structure in providing nasal support. Because of a variety of potential etiologies nasal septum could be severely deformed or even diminished. Autogenous cartilage has generally been considered the gold standard grafting material in reconstructive septal surgery for creating the infrastructure of the nose. In the restructuring of the nasal skeleton autogenous cartilage can be harvested from the auricle or the rib. For the major septal problems requiring a large volume of tissues with severe structural defects costal cartilage is considered the best graft material. Apart from its advantages, warping has been the main problem with costal cartilage grafting. Oblique split method, provides straight costal cartilage grafts of varying thicknesses without the risk of warping. Segmental reconstruction of the L-strut with oblique split method, composed of dorsal and caudal struts, enables fine adjustment of height of the reconstructed septum. Thieme Medical Publishers 333 Seventh Avenue, New York, NY 10001, USA.
Time complexity analysis of support vector machines(SVM) in LIBSVM
[J].
基于无人机多光谱遥感影像的地物分类方法研究
[D].
Study of object classification based on multispectral images of UAV
[D].
/
〈 |
|
〉 |
