利用机载LiDAR数据和高分辨率图像提取复杂城区建筑物
王雪1, 李培军2, 姜莎莎3, 刘婧4, 宋本钦5
1.香港中文大学地理与资源管理学系,香港 999077
2.北京大学地球与空间科学学院遥感所,北京 100871
3.路易斯安那州立大学工程科学项目,洛杉矶 70803
4.屯特大学国际地理信息科学与地球观测学院,恩斯赫德 7500
5.中国电子科学研究院,北京 100041

第一作者简介: 王 雪(1990-),女,博士研究生,研究方向为高空间分辨率遥感城市变化检测。Email:wsnow@link.cuhk.edu.hk

摘要

在复杂城区内部通常存在大量的阴影,建筑物的屋顶也有多种类型,这使得利用高分辨率遥感图像自动提取建筑物变得困难。针对上述2个问题,提出了一种综合利用高分辨率图像与机载LiDAR数据的城市建筑物提取新方法。首先,对归一化植被指数(normalized difference vegetation index,NDVI)和LiDAR高度数据设定阈值得到初步的建筑物提取结果; 然后,分别利用阴影区NDVI、图像纹理和形态学滤波来改进结果; 最后,采用局部的机载LiDAR数据和QuickBird图像,对提出的方法进行验证,并与现有方法进行比较。研究结果表明,该方法可有效减少由阴影和不同屋顶特征所造成的错误识别,显著提高了建筑物提取精度。

关键词: 建筑物提取; 高分辨率图像; 机载LiDAR; 阴影; 冷色屋顶; 多层次
中图分类号:TP 79 文献标志码:A 文章编号:1001-070X(2016)02-0106-06 doi: 10.6046/gtzyyg.2016.02.17
Building extraction using airborne LiDAR data and very high resolution imagery over a complex urban area
WANG Xue1, LI Peijun2, JIANG Shasha3, LIU Jing4, SONG Benqin5
1. Department of Geography and Resource Management, The Chinese University of Hong Kong, Hong Kong 999077, China
2. Institute of Remote Sensing and GIS, School of Earth and Space Sciences, Peking University, Beijing 100871, China
3. Engineering Science Program, Louisiana State University, Los Angeles 70803, USA
4. Faculty of Geo-information Science and Earth Observation of Twente University, Enschede 7500 AE, the Netherlands
5. China Academy of Electronics and Information Technology, Beijing 100041, China.
Abstract

The occurrence of shadow and diverse building roofs in complex urban areas makes it difficult to extract building automatically using very high resolution (VHR) imagery over these areas. In order to solve these two problems, this paper proposed a novel method for building extraction using airborne LiDAR data and VHR imagery. The buildings were initially extracted by thresholding the normalized difference vegetation index (NDVI) image and LiDAR height data. The initially obtained result was then refined by using NDVI image over shadow areas, image texture and morphological filtering. The proposed method was quantitatively evaluated and compared with existing methods using airborne LiDAR data and QuickBird image of Nanjing City, China. The results indicated that the proposed method effectively reduced the extraction errors caused by shadow and diverse building roof and significantly improved the accuracy of building extraction.

Keyword: building extraction; very high resolution imagery; airborne LiDAR; shadow; cool-colored roof; multi-level
0 引言

城市建筑物信息是城市规划、土地利用分析和灾害评估等很多城市应用所需要的重要数据[1]。近年来, IKONOS, QuickBird, GeoEye-1和WorldView-2等高分辨率遥感数据的大量获取, 使得利用遥感技术提取建筑物成为可能。然而, 由于建筑物与其他地物(如道路)的光谱相似性, 仅利用高分辨率图像很难准确地提取建筑物[2]。激光雷达 (light detection and ranging, LiDAR)所提供的高度数据, 为建筑物的提取提供了补充信息[2, 3], 因此, 综合利用高分辨率图像和LiDAR数据可以更有效地提取城市建筑物[2]

近年来, 有很多利用高分辨率图像和机载LiDAR数据提取城市建筑物的研究, 采用的提取方法包括阈值法、图像融合法和轮廓提取法等[2, 4, 5]。然而, 这些研究大多集中于新算法的开发, 且用于验证算法的研究区一般都是相对简单的城区, 针对复杂城区的建筑物提取研究较少[2]。因为在复杂城区, 存在高度不同、且形状不规则的建筑物, 高大建筑物和树木的阴影遮蔽了较矮的建筑物和树木, 使得阴影区的地物光谱特征发生改变[6]。例如, 阴影区内树木归一化植被指数(normalized difference vegdation index, NDVI)变得很低, 与建筑物的NDVI值相似, 仅利用NDVI很难区分阴影区内部的树木与建筑物[7]。另一方面, 复杂城区内建筑物的屋顶有多种类型, 特别是为了有效减少城市热岛效应, 近几年冷色屋顶(蓝色、绿色屋顶)或种有植被的屋顶越来越多[8], 这类屋顶在近红外波段的反射率很高, 与植被有相似的光谱特征。尽管在以往的研究中[9, 10, 11], 也发现了区分这2类屋顶的困难, 但是却没有一种有效的解决方法。因此, 针对上述2个问题, 本文提出了一个利用LiDAR和高分辨率图像提取复杂城区建筑物的新方法。

1 提取方法

面向对象的分析方法通常比基于像素的方法可获得更高精度的分类结果[12], 本文采用面向对象的方法来提取城市建筑物。首先, 分别对LiDAR高度数据与高分辨率图像进行分割, 得到相应的图像对象; 其次, 以LiDAR数据的分割结果为基准, 分别计算每一个对象的高度均值及NDVI均值并进行阈值法分类, 初步提取城市区域的建筑物和树木; 然后, 对初步提取的建筑物和树木结果进行优化; 最后, 对优化后的结果进行后处理, 进一步改善建筑物提取结果。本文方法流程图见图1

图1 方法流程Fig.1 Flowchart of the proposed method in this paper

1.1 图像分割

面向对象处理的首要步骤是图像分割。考虑到本文所采用的多层次方法需要不同尺度的分割结果, 即建筑物的提取、阴影的提取以及对阴影的进一步分类, 可以采用任何一种多层次分割算法。本文采用Li等[13]提出的基于数学形态学的图像分割方法。该方法是将多波段的分水岭变换和分水线动态范围结合, 进而得到多尺度多层次的图像分割结果。此方法已被应用于城市不透水层提取以及地震引起的道路损毁检测[14, 15]

利用上述图像分割方法分别对LiDAR高度数据与高分辨率图像进行分割。采用LiDAR数据的分割结果作为本研究提取建筑物的基准, 而高分辨率图像的分割结果则只用于阴影区的提取, 以及对阴影区内部植被与非植被的区分。

1.2 建筑物的初步提取

对高分辨率图像和LiDAR高度数据进行图像分割得到图像对象后, 采用阈值法[2]初步提取建筑物, 即分别对LiDAR高度数据和NDVI图像设定阈值: 高于高度阈值且低于NDVI阈值的对象识别为建筑物; 高于高度阈值且高于NDVI阈值的对象识别为树木; 其他对象(即草地和地面)被掩模掉, 不参与后续处理。

对结果的初步分析发现, 直接利用高度和NDVI设定阈值来提取建筑物存在2个问题。第一, 阴影区的树木被错分为建筑物, 因为阴影区树木的NDVI值通常很低, 与建筑物的NDVI值相近; 第二, 具有冷色屋顶或植被覆盖屋顶的建筑物被错分为树木, 因为这2类屋顶具有很高的近红外波段反射率, 与树木有相似的反射光谱特征[8]

针对这2个问题, 本文提出了对初步提取结果进行优化的方法。优化方法包括2步: ①从建筑物的初步提取结果中去除在阴影区被错分为建筑物的树木; ②从树木的初步提取结果中, 区分出具有冷色屋顶或植被覆盖屋顶的建筑物。

1.3 阴影区树木的去除

为了去除阴影区内被错分为建筑物的树木, 首先基于高分辨率图像的分割结果及其光谱信息提取阴影区。本文采用亮度直方图阈值法[7]来提取阴影, 这是一个简单但有效的方法, 被广泛应用于阴影区的提取[7]。提取出阴影区之后, 将阴影区与建筑物初步提取结果进行叠加, 确定位于阴影区内的建筑物对象, 其中包括被误分的树木; 然后对阴影区内建筑物和树木的NDVI值进行初步统计, 确定一个合适的NDVI阈值来区分阴影区的树木和建筑物; 最后将阴影区的树木从建筑物初步提取结果中剔除。

1.4 特定屋顶的建筑物提取

为了提取错分为树木的具有冷色屋顶或植被覆盖屋顶(即特定屋顶)的建筑物, 本研究试验了很多方法[9, 11], 但仍无法有效区分这2类屋顶。因此, 本文提出了一种新的方法。

通常情况下, 树木和建筑物的光谱特征和高度在空间变化上有很大的不同: 树木具有较显著的空间变化(纹理), 而建筑物的屋顶则相对较均匀(外表光滑, 无纹理)。所以, 本文利用图像纹理来区分树木和特定屋顶的建筑物。

本文利用实验变异函数来计算图像纹理, 这是一个被广泛应用的纹理计算算法[17], 其表达式为

γ exp(h)= 12N(h)i=1N(h)[DN(xi)-DN(xi+h)]2 , (1)

式中: xi为像元i的空间位置; DN为光谱亮度值; h为具有方向和大小的滞后距离(lag)向量; N(h)为距离为h的像元对的数量。

提取特定屋顶建筑物的方法为: 首先, 考虑到建筑物都占有较大的面积, 设定一个面积阈值, 将一些小面积的对象(例如一棵树)从树木的初步提取结果中去除, 去除后得到的结果包含大片的树林和特定屋顶的建筑物; 然后, 设定一个纹理阈值, 对上一步结果中的每一个像元进行分析判断, 如果这个像元的纹理值低于此阈值, 就被标记为建筑物, 反之被标记为树木; 最后, 基于面向对象的处理方法, 采取简单众数规则确定每个对象是否为建筑物, 如果50%以上的像元被标记为建筑物时, 此对象便被分类为建筑物, 反之被分类为树木。

本文分别采用LiDAR nDSM和高分辨率全色图像来计算图像纹理, 再分别提取特定屋顶的建筑物, 然后进行定量比较, 选择最好的提取结果与阴影区去除树木后的建筑物提取结果合并。

1.5 后处理

为了进一步改善上述步骤得到的建筑物提取结果, 本文提出了一种后处理方法: ①由于建筑物通常占有较大面积, 所以设定一个面积阈值来去除掉小面积的对象; ②由于提取的建筑物对象和边缘往往都不规则(如内部不连续、有空洞), 所以利用基于数学形态学的方法来解决该问题。首先, 进行基于腐蚀的形态学重建[18], 使得建筑物中的洞被填充的同时, 建筑物的边缘保持不变; 然后, 进行开运算, 使得建筑物的边缘变得笔直且规则。

1.6 精度评价

利用LiDAR数据与高分辨率图像, 通过人工目视解译和实地考察, 得到整个研究区的建筑物分布, 并作为参考数据来评价建筑物提取结果。

本文分别采用3种方法来进行精度评价: ①经典的混淆矩阵方法, 也称为基于像素指标的评价方法[2], 得到总体分类精度、Kappa系数、生产者精度和用户精度4种评价指标[19]; ②统计结果图像和参考图像中建筑物重叠的数量, 也称为基于对象指标的评价方法[2], 该方法包含2种指数, 一种是完整性, 即生产者精度, 另一种是正确性, 即用户精度[19]; ③分析提取误差的空间分布, 通过逐个像素的比对, 分别对正确提取、错分和漏分3种情况进行统计分析, 最终得到误差空间分布。

为了验证本文所提出方法的有效性, 将本文方法与2种现有方法进行对比。第1种方法是直接对LiDAR高度数据及NDVI图像采用阈值法来提取建筑物。第2种方法是对第1种方法得到的建筑物提取结果再进行后处理。

2 研究区及数据源

本文研究区位于江苏省南京市鼓楼区, 包括南京大学及其周边地区, 是非常复杂的城市建成区, 覆盖面积约140 000 m2。该区域内街道和建筑物周围树木密集, 有很多非常高的居民楼和商务楼, 形成了大量阴影, 一些建筑物和树木位于阴影区内。同时, 此区域的建筑物屋顶的材质和颜色多种多样。有一些建筑物是冷色屋顶(蓝色和绿色), 还有一些屋顶上种有植被(主要是草)。这些复杂的情况使得建筑物的自动提取变得困难。

本文数据源为QuickBird高分辨率影像和机载LiDAR点云数据。QuickBird图像获取时间为2009年11月22日, 包括4个多光谱波段(空间分辨率为2.4 m)和1个全色波段(空间分辨率为0.6 m)。利用 Gram-Schmidt方法[20]将多光谱和全色图像融合, 获得锐化后的多光谱融合图像。

LiDAR 数据采集时间为2009年4月22日, 利用Optech公司的ALTM(airborne laser terrain mapper) Gemini[21]机载激光测量仪获得, 平面精度0.25 m, 高程精度0.15 m。利用LiDAR的点云数据, 首先生成数字表面模型(digital surface model, DSM)和数字高程模型(digital elevation model, DEM)图像。DSM和DEM相减后, 得到归一化数字表面模型(normalized DSM, nDSM), 代表了地物相对于地面的高度。以全色波段图像为参考图像, 将nDSM图像与多光谱融合图像进行配准。对配准后的QuickBird和nDSM图像进行裁剪, 得到大小为1 364像素× 936像素的研究区图像(图2)。

研究区数据

Fig.2 data of study area

3 结果和讨论

本文分割尺度是通过对不同尺度的分割结果进行目视分析以及比较分类或信息提取的精度来确定的。nDSM图像和QuickBird图像初步分割尺度都为25, 用于进一步区分阴影区植被和建筑物的分割尺度则为10。阈值主要是根据研究区内相关特征的统计结果以及试错过程而确定的。在建筑物初步提取中, nDSM和NDVI的阈值分别为5和0.09。阴影提取中, 亮度阈值为247。区分阴影区中的建筑物和树木的NDVI阈值为0.01。后处理中, 面积阈值为250像素; 腐蚀运算的结构元素是半径为10像素的圆; 开运算的结构元素是8像素× 8像素的正方形。表1列出了利用不同方法提取的建筑物信息基于像素指标的精度评价结果。

表1 不同方法提取的建筑物结果基于像素指标的精度评价 Tab.1 Pixel level accuracy of building extraction using different methods(%)

表1中可以看出, 3种方法的总体精度都大于90%, 但是, 直接利用阈值法提取建筑物的Kappa系数仅为79.19%; 当对阈值法的结果进行后处理(以下简称“ 阈值法+后处理” ), 则Kappa系数增加了3.08%; 而本文方法Kappa系数有更明显的提升, 提高了6.17%。

表2是利用不同方法提取的建筑物信息基于对象指标的精度评价结果。

表2 不同方法提取的建筑物结果基于对象指标的精度评价 Tab.2 Object-level accuracy of building extraction using different methods(%)

表2中可以看出, 直接利用阈值法提取建筑物的结果有很高的完整性(90.04%), 但正确性很低(66.24%), 表明虽然大多数的建筑物被正确提取出来, 但很多非建筑物对象(如阴影区的树木)却被错分为建筑物; 阈值法+后处理的方法在保持较高完整性的同时, 正确性提升了24.19%; 本文方法正确性有更明显的提升, 达到95.56%, 并且完整性也提升到了93.07%。

图3是不同方法提取建筑物的结果。

图3 不同方法的建筑物提取结果Fig.3 Building extraction results using different methods

图3中可以看出, 直接采用阈值法虽然大多数的建筑物都被正确提取出来, 但是建筑物的形态和边界并不规则, 还有很多噪声, 同时一些阴影区的树木被错分为建筑物(图3(a)中红圈内部), 很多特定屋顶的房屋被漏分。阈值法+后处理方法的提取结果有了很明显的改善, 大部分噪声被去除, 建筑物的形态和边界也变得更规则, 然而仍存在部分错分和漏分现象(图3(b))。本文方法提取建筑物的结果(图3(c))不仅提取结果有了明显的改善, 而且大部分阴影区内部的树木被去除, 大多数特定屋顶的建筑物被正确提取出来。

图4是不同方法的误差空间分布情况。

图4 误差空间分布Fig.4 Spatial distribution of errors

图4中可以看出, 直接采用阈值法提取的结果既有很多错分(绿色区域, 如阴影区的树木), 也有很多漏分(蓝色区域, 如特定屋顶的建筑物); 采用阈值法+后处理的方法, 阴影区树木所造成的错分现象虽明显减少, 但漏分现象却仍然存在; 而本文方法得到的提取结果中, 错分误差和漏分误差都有明显减少, 这证明了本文方法的有效性。

通过误差分析发现, 本文方法仍存在一些漏分和错分现象。存在漏分现象(蓝色区域)的原因主要有2方面: ①有些建筑物的高度较低, 在初步的阈值分类时被遗漏; ②由于LiDAR数据存在误差, 导致很多平滑的建筑物表面在高度上参差不齐。

造成错分现象(绿色区域)的原因也主要有2方面: ①少部分阴影区的阴影非常浓重, 致使这些树木的NDVI值非常低; ②由于有一些树木被包含在建筑物区域内或非常接近建筑物, 具有较低的NDVI值。同时, 在建筑物的边缘也有一些错分, 这是由于LiDAR数据较低的水平精度[22]以及提取结果与参考图像之间的配准误差造成的; 并且, 图像分割误差也会影响到建筑物提取结果。这些误差分析为今后的相关研究提供了启示和线索。

4 结论

利用高分辨率图像进行复杂城区的建筑物提取是一项困难的任务。针对复杂城区内的阴影, 以及具有冷色屋顶或植被覆盖屋顶的建筑物与树木之间的光谱相似性, 本文提出了一种综合利用高分辨率图像与机载LiDAR数据的多层次提取复杂城市建筑物的新方法, 并利用实际数据, 通过与现有方法比较验证了本文方法的有效性。

1)本文方法结合了高分辨率图像和机载LiDAR数据的优势, 充分利用光谱信息、图像纹理、形状信息和高度数据等来提取复杂城区的建筑物。

2)与现有方法相比, 本文方法有效减少了由阴影和不同类型的屋顶所造成的建筑物错分和漏分现象, 建筑物提取精度显著提高, 可应用于具有类似情况的复杂城区的建筑物提取。

3)进一步的误差分析发现, 本文方法得到的建筑物提取结果仍存在少量错分和漏分现象, 需要进一步研究解决。在今后的研究中将考虑结合LiDAR数据的其他信息, 如强度信息和多次回波特征等。

The authors have declared that no competing interests exist.

参考文献
[1] Hussain E, Ural S, Kim K H, et al. Building extraction and rubble mapping for city Port-au-Prince post-2010 Earthquake with Geoeye-1 imagery and LiDAR Data[J]. Photogrammetric Engineering and Remote Sensing, 2011, 77(10): 1011-1023. [本文引用:1]
[2] Awrangjeb M, Ravanbakhsh M, Fraser C S. Automatic detection of residential buildings using LiDAR data and multispectral imagery[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2010, 65(5): 457-467. [本文引用:8]
[3] 李迁, 肖春蕾, 陈洁, . 基于机载LiDAR点云和建筑物轮廓线构建DSM的方法[J]. 国土资源遥感, 2013, 25(2): 95-100. doi: DOI: 106046/gtzyyg. 2013. 02. 17.
Li Q, Xiao C L, Chen J, et al. Method for constructing DSM based on building contour line and airborne LiDAR data[J]. Remote Sensing for Land and Resources, 2013, 25(2): 95-100. doi: DOI:10.6046/gtzyyg.2013.02.17. [本文引用:1]
[4] Rottensteiner F, Trinder J, Clode S, et al. Using the Dempster-Shafer method for the fusion of LiDAR data and multi spectral images for building detection[J]. Information Fusion, 2005, 6(4): 283-300. [本文引用:1]
[5] 李云帆, 龚威平, 林俞先, . LiDAR点云与影像相结合的建筑物轮廓信息提取[J]. 国土资源遥感, 2014, 26(2): 54-59. doi: DOI: 106046/gtzyyg. 2014. 02. 10.
Li Y F, Gong W P, Lin Y X, et al. The extraction of building boundaries based on LiDAR point cloud data and imageries[J]. Remote Sensing for Land and Resources, 2014, 26(2): 54-59. doi: DOI:10.6046/gtzyyg.2014.02.10. [本文引用:1]
[6] Ranson K J, Daughtry C S T. Scene shadow effects on multispectral response[J]. IEEE Transactions on Geoscience and Remote Sensing, 1987, 25(4): 502-509. [本文引用:1]
[7] Zhou W Q, Huang G L, Troy A, et al. Object-based land cover classification of shaded areas in high spatial resolution imagery of urban areas: A comparison study[J]. Remote Sensing of Environment, 2009, 113(8): 1769-1777. [本文引用:3]
[8] Levinson R, Berdahl P, Akbari H. Solar spectral optical properties of pigments-Part I: Model for deriving scattering and absorption coefficients from transmittance and reflectance measurements[J]. Solar Energy Materials and Solar Cells, 2005, 89(4): 319-349. [本文引用:2]
[9] Hu J B, Chen W, Li X Y, et al. Roof confusion removal for accurate vegetation extraction in the urban environment[C]//International Workshop on Earth Observation and Remote Sensing Applications. Beijing: IEEE, 2008: 1-7. [本文引用:2]
[10] Cablk M E, Minor T B. Detecting and discriminating impervious cover with high-resolution IKONOS data using principal component analysis and morphological operators[J]. International Journal of Remote Sensing, 2003, 24(23): 4627-4645. [本文引用:1]
[11] Pesaresi M, Gerhardinger A, Haag F. Rapid damage assessment of built-up structures using VHR satellite data in tsunami-affected areas[J]. International Journal of Remote Sensing, 2007, 28(13/14): 3013-3036. [本文引用:2]
[12] AL-Khudhairy D H A, Caravaggi I, Giada S. Structural damage assessments from IKONOS data using change detection, object-oriented segmentation, and classification techniques[J]. Photogrammetric Engineering and Remote Sensing, 2005, 71(7): 825-837. [本文引用:1]
[13] Li P J, Guo J C, Song B Q, et al. A multilevel hierarchical image segmentation method for urban impervious surface mapping using very high resolution imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2011, 4(1): 103-116. [本文引用:1]
[14] Zhang J, Li P J, Mazher A, et al. Impervious surface extraction with very high resolution imagery in urban areas: Reducing tree obscuring effect[C]//International Conference on Computer Vision in Remote Sensing. Xiamen: IEEE, 2012: 94-99. [本文引用:1]
[15] Li P J, Xu H Q, Song B Q. A novel method for urban road damage detection using very high resolution satellite imagery and road map[J]. Photogrammetric Engineering and Remote Sensing, 2011, 77(10): 1057-1066. [本文引用:1]
[16] Benz U C, Hofmann P, Willhauck G, et al. Multi-resolution, object-oriented fuzzy analysis of remote sensing data for GIS-ready information[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2004, 58(3/4): 239-258. [本文引用:1]
[17] Rodriguez-Galiano V F, Chica-Olmo M, Abarca-Hernand ez F, et al. Rand om forest classification of Mediterranean land cover using multi-seasonal imagery and multi-seasonal texture[J]. Remote Sensing of Environment, 2012, 121: 93-107. [本文引用:1]
[18] Gonzalez R C, Woods R E, Eddins S L. Digital Image Processing Using MATLAB[M]. 2nd ed. USA: Gatesmark Publishing, 2009: 827. [本文引用:1]
[19] Foody G M. Status of land cover classification accuracy assessment[J]. Remote Sensing of Environment, 2002, 80(1): 185-201. [本文引用:2]
[20] Laben A, Brower B V. Process for enhancing the spatial resolution of multispectral imagery using pan-sharpening: USA, 6011875[P/OL]. 2000-01-04[2015-01-30]. http://www.freepatentsonline.com/6011875.html. [本文引用:1]
[21] Chen L, Zhao S H, Han W Q, et al. Building detection in an urban area using LiDAR data and QuickBird imagery[J]. International Journal of Remote Sensing, 2012, 33(16): 5135-5148. [本文引用:1]
[22] Li Y, Wu H Y. Adaptive building edge detection by combining LiDAR data and aerial images[C/OL]//The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. Beijing: ISPRS, 2008: 197-202. http://www.isprs.org/proceedings/XXXVII/congress/1_pdf/33.pdf. [本文引用:1]