基于数据场和密度聚类的高分辨率影像居民区提取
岳梦雪1, 秦昆1,2, 张恩兵1, 张晔1, 曾诚1
1.武汉大学遥感信息工程学院,武汉 430079
2.地球空间信息技术协同创新中心,武汉 430079

第一作者: 岳梦雪(1993-),女,硕士研究生,主要研究方向为高分辨率遥感图像信息提取、空间分析。Email:yuemx@whu.edu.cn

摘要

数据场通过模拟物理场中对象间的相互作用,来描述数据对象间的相互作用关系。数据场中的势值高低反映对象间相关程度,故在遥感影像中可用数据场来刻画像元间的空间相关性特征。提出了一种基于数据场和密度聚类的高分辨率居民区有效提取的方法。首先,利用数据场计算遥感影像的势值特征图像; 然后,对势值图像进行分水岭分割,提取分割所得对象块的形心; 最后,对形心进行基于密度的聚类,从而实现居民区提取。实验结果表明,基于此方法进行高分辨率遥感影像的居民区提取相对于传统方法具有更好的鲁棒性和高效性。

关键词: 数据场; 空间相关性; 密度聚类; 高分辨率遥感影像; 居民区提取
文献标志码:A 文章编号:1001-070X(2017)03-0092-06
Residential area extraction for high resolution remote sensing image based on data field and density clustering
YUE Mengxue1, QIN Kun1,2, ZHANG Enbing1, ZHANG Ye1, ZENG Cheng1
1. School of Remote Sensing and Information Engineering, Wuhan University, Wuhan 430079, China
2. Collaborative Innovation Center of Geospatial Technology, Wuhan 430079, China
Abstract

Data field can describe the correlation between data objects, and is a simulation of interaction between particles in physical field. Potential value of a data object in data field can effectively represent the spatial interactions of its neighborhoods, and it can do so for pixels in high resolution remote-sensing image. In this paper, the authors propose a method for residential area extraction from high resolution remote-sensing image using data field and density clustering. The major steps are as follows: the generating of a high resolution remote-sensing image data field; the calculation if potential value for each pixel in this field to obtain a new feature image; the segmentation of the feature image via watershed segmentation, and the calculation of centroids of segmentation results; the clustering of all the centroids into different clusters based on the density, with the extracted residential area composed of target clusters. Compared with existing relative methods of residential areas extraction for high resolution remote-sensing images, the experimental results suggest that the presented method is robust and efficient.

Keyword: data field; spatial correlation; density clustering; high resolution remote-sensing image; residential areas extraction
0 引言

对居民区的准确和有效提取, 将会为地理国情普查、土地利用管理和城市规划等应用提供重要的基础信息支持。在当前广泛应用的高空间分辨率(以下简称“ 高分” )遥感影像中, 复合居民区对象内部包含丰富的纹理结构和空间布局模式等信息, 通常利用其纹理特征[1, 2]、角点特征[3]和边缘特征[4, 5], 结合分割、空间投票和分类等方法实现居民区提取, 但这些特征有些较为底层, 居民区提取效率或精度偏低。因此, 对空间结构特征的准确建模表达和有效利用, 成为当前高分影像居民区提取的关键研究问题之一。

数据场是一种描述空间数据对象间相关性结构特征的有效方法, 在遥感影像的结构特征描述中已有学者做过探索[6]。通过将影像像元类比成电场中的质点, 以影像灰度值类比为质点电荷量, 则影像的中心像元与邻域像元通过数据场相互作用[7], 产生了反映相互作用大小的势值, 进而得到类似于物理场的影像数据场, 势值的高低反映了局部空间范围内像素属性相关性的强烈程度, 因而可用于揭示空间结构特征[8, 9, 10]

为此, 本文提出了一种基于数据场和密度聚类的高分辨率遥感影像居民区提取方法。首先, 对原始影像进行数据场特征计算; 然后, 将面向对象方法应用到后续处理中, 采用分水岭算法对获得的特征图像进行对象分割, 得到相关性特征明显的各对象单元; 最后, 引入密度聚类算法, 将各分割对象进行聚类, 得到最终的居民区提取结果。由于采用了面向对象和密度聚类方法来进行目标的快速识别, 从而在计算效率和提取的准确性方面较传统方法都有明显的改善。

1 理论与算法描述
1.1 数据场特征计算

给定数据空间Ω 中的一个数据粒子位于x处, 则该粒子在任意点yΩ 处产生的势值φ x(y)为

φ x(y)=m e-|x-y|σk, (1)

式中: m≥ 0代表场源强度, 用数据对象质量表示; e为自然底数; σ ∈ (0, +∞ )为影响因子, 用于控制数据对象之间的相互作用历程; kN为距离指数, 当k=2时, 势函数对应核力场的高斯势函数。若将一幅大小为m× n的图像中每个像元点视为二维空间中的一个数据对象, 像元点的灰度ρ ij(i, j)(i=1, 2, …, m; j=1, 2, …, n)视为数据对象的质量, 根据数据场的势函数公式, 以及数据场的叠加性, 则所有像元点与其邻域像元在二维图像空间中的相互作用, 就可以确定一个图像数据场, 而场中在位置处的数据势值计算公式为

φ (x)= i=1mj=1nxij| e-|x-xij|σ2, (2)

式中: ρ xρ ij分别为位置x, (i, j)处像元灰度值; xij|代表场源强度。

为了能让数据场更全面、更准确地反映在遥感影像中, 整个邻域内灰度属性的相关性, 使其具有更强的抗噪能力, 本文考虑将窗口内的每一像元看作中心像元, 综合考虑窗口内的所有像元, 进而描述像元灰度的统计特性。给定位置x处像元为中心, 其局部邻域Ω 包含N个相邻对象, 且相邻元素在各自位置处均产生数据场, 并具有相应势值, 则在该局部邻域Ω 内, x点的遥感影像数据场势函数, 可表示为

φ (x)= x'ΩNφ (x')= x'ΩNxijξ(x')ρx'-ρije-|x'-xij|σ2, (3)

式中: φ (x)为高分辨率遥感影像内x点处像元的数据场势函数值; φ (x')为中心像元x的某相邻点x'的势值; ξ (x')为x'的辐射区域, ξ (x')={xij|||x'-xij||≤ 3σ / 2}; xijξ (x')中的元素。遥感影像数据场特征计算方法中, 像元间的相互作用如图1所示。

图1 像元间的相互作用Fig.1 Interaction between pixels

基于遥感影像数据场所计算的特征更好地兼顾了邻近像元势值对中心像元的影响, 对影像内部潜在的空间结构特性具有更好的刻画。由于高分辨率影像的每个像元处都有其对应的数据场势特征值, 因此, 所有的像元便重新构成一幅数据场特征图像。

1.2 分割与形心密度聚类

遥感影像中, 居民区内部的建筑物屋顶属性相似性较高, 则建筑物目标在数据场特征图像中, 对应的特征值较高, 同时背景等区域特征值大小差异性较大。因此, 针对数据场特征图像中不同区域特征值差异较大的现象, 使用分水岭方法分割[11], 以获得不同目标对象块。由于居民区是由多个房屋建筑聚集而成的复合地物目标, 故在分割过程中会产生较多对象块, 该类对象块分布较为密集、形心密度较高, 异于农田、森林植被及水域等其他属性相似性较高的背景区域。因此, 可根据对象块形心的密度来区分居民区目标与背景区域。

基于密度的聚类算法, 从对象分布密度出发, 把一定密度的区域进行连接, 从而发现不同的团簇和区域。常用的基于密度聚类的算法有很多, 其中DBSCAN算法[12]较为常用, 该方法根据数据对象的密度, 将对象聚成不同的类, 所聚集成的类无形状限制, 且具有一定的抗噪性, 可以在具有噪声的数据中获得目标类簇。由于DBSCAN算法的聚类效果与EpsMinPts相关, 而遥感影像中, 决定地物类别的不只是一定范围内地物特征点的密度, 还与其属性特征相关, 如灰度特征。因此, 在Eps邻域内, 当特征点同时满足密度条件和灰度特性才被认为是同一类地物, 故实验所需给定的参数包括EpsMinPts以及遥感影像灰度特征控制参数g。DBSCAN算法对定义的参数敏感, 参数上细微的改变都可引起结果出现巨大的变化, 因此本文通过试错法确定参数。

1.3 居民区提取方法

在特征图像计算方法和相关参数确定后, 建立基于数据场和密度聚类的高分辨率居民区提取方法的算法流程, 如图2所示。

图2 居民区提取流程图Fig.2 Flow-process diagram of residential area extraction

关键步骤如下:

1)利用数据场理论公式(3), 确定合适的影像因子σ , 计算遥感影像的数据场势值特征。

2)使用标记符控制的分水岭分割方法, 对遥感影像的数据场特征图像进行分割。

3)对图像分割所得到的对象块, 分别求取其形心, 得到形心集合C

4)确定聚类参数, 对形心集合C进行基于密度的聚类, 根据聚类结果获取属于居民区对象的标签集合, 通过标签找到居民区对象块。

5)利用形态学方法开闭运算进行后处理, 合并居民区对象块, 最终得到居民区提取结果。

2 实验与分析

为了验证本文算法的鲁棒性与有效性, 选取3种不同传感器的影像数据, 每种传感器选择2个实验区, 对所获得的实验区遥感影像数据进行实验。实验区QB1和QB2为分辨率0.61 m的QuickBird影像数据, 大小分别为1 022像元× 1 108像元和806像元× 604像元; 实验区WV1和WV2为分辨率0.52 m的WordView2影像数据, 大小分别为2 160像元× 2 251像元和761像元× 919像元; 实验区ZY1和ZY2为分辨率2.1 m的资源三号影像数据, 大小分别为1 029像元× 687像元和1 199像元× 408像元。所选取的遥感影像实验数据均充分包含居民区和复杂地物背景, 能满足实验所要达到的目的。实验区QB1如图3所示。

图3 实验区QB1Fig.3 Experimental zone QB1

计算实验区QB1的原始影像数据场势值, 其势值特征图像描绘如图3(b), 从图中可以发现, 颜色较明亮的区域为数据场势值高的区域。对比数据原始影像图可以发现, 该区域对应为居民区建筑部分。在影响因子σ 确定的情况下, 高分辨率影像数据场势值的大小与像元的属性值和像元间的空间相关性2个因素有关。取影像中像元的灰度值作为属性值, 在数据原始影像图中, 组成居民区的建筑物具有相似的灰度属性, 因此像元的属性值间的差异较小, 故可推断数据场势值高的区域, 其空间相似性高, 而这一推断亦符合实际情况, 即建筑物本身内部的相似性显著高于建筑物与其相邻地物间的相似性, 所以, 数据场势值可以作为有效描述居民区的特征值。

为了衡量对遥感影像中居民区提取的效果, 需对结果进行精度评定, 本文以查全率R和查准率P作为参照, 以二者的调和平均值F1测度作为主要的评价依据, 其定义分别为

R= TPTP+FN, (4)

P= TPTP+FP, (5)

F1= 2PRP+R, (6)

式中: TP为真正类, 表示提取的居民区是真实居民区的像元数目; FP为假正类, 表示提取的居民区是非居民区的像元数目; FN为假负类, 表示提取的非居民区是居民区的像元数目。

首先, 直接利用分水岭图像分割方法对遥感影像数据进行分割, 由于原始影像数据中地物信息较复杂, 对应的梯度幅度图像中高值间的差异较小, 会出现欠分割现象, 影响居民区的提取效果。由于高分辨率数据场势值大小可反映地物的结构特性, 分水岭分割方法的浸水思想在此情况下可以发挥优势, 故计算遥感影像的数据场特征图像后进行分割, 可改善欠分割现象。但由于居民区是各独立居民建筑的集合, 因而利用数据场特征图像分割所得结果是各独立建筑的目标块。以每个目标块的形心代表分割的结果如图4所示。

图4 分割结果的形心Fig.4 Centroids of segmentation results

图4(b)中可以看出, 在高势值区域, 形心点密度较大, 即分割得到的目标块较多, 代表该区域建筑物分布密集为居民区。相反, 势值较低的区域, 在分水岭分割过程中, 视为地势较低处, 分割得到的目标块较大, 在一定范围的区域中, 目标块越大数量就越少, 故这一类的目标块形心分布较稀疏, 而农田或裸地这一类地物符合这种特性。

然后, 根据目标块形心点密度的大小差异与分布特性, 可对其进行基于密度的聚类, 以获取完整的居民区域。本文使用综合像元灰度属性的DBSCAN算法实现对目标块的聚类。聚类结果中, 核心点所代表的对象块为居民区内部地物块, 边缘点则对应过渡区地物块, 噪声点代表非居民区地物块。因此, 剔除聚类结果中的噪声点, 对剩余点所对应的分散目标区域块利用形态学开闭运算方法进行合并, 特殊情况下需要进行空洞填充或小面积区域滤除, 最终可获得目标居民区。若高分辨率影像中出现大尺度地物, 且无法确定其是否为居民建筑物时, 要同时剔除噪声点和边缘点, 再进行居民区提取。最后, 把提取出的居民区与原图叠加, 结果如图5所示。

图5 本文方法对实验数据中居民区提取结果图Fig.5 Results of residential area extraction for all experimental zones using our method

为了证明本文方法的有效性, 使用空间投票方法[13]对相同的数据进行居民区的提取, 并从提取结果精度和计算代价2个方面对结果进行对比。其中, 基于空间投票的方法通过Gabor滤波来提取居民区的特征点, 然后利用这些点进行空间投票, 根据空间投票结果进行最优决策提取居民区, 结果见图6

图6 基于空间投票法对实验数据中居民区提取结果图Fig.6 Results of residential area extraction for all experimental zones using spatial voting

本实验对不同数据中居民区过程中相应的计算代价和提取精度如表1所示。

表1 不同方法居民区提取的计算代价与精度 Tab.1 Calculation costs and accuracy of residential area extraction based on different methods

图6的实验结果和表1中可以发现, 使用空间投票法一定程度上可以提取出居民区, 但是其提取结果中包含较多背景区域, 伪检现象严重, 精度偏低, 查全率虽与本文方法维持在相同水平, 但该方法的F1测度较低, 居民区提取结果差异性较大, 且处理时间长。使用本文方法进行居民区提取时, 虽然实验区WV2的影像中存在部分建筑漏检现象, 但其他实验区影像中提取出的居民区完整性好, 查准率较高。

2种方法的F1测度如图7所示, 可以看出, 本文方法对不同传感器影像数据中的居民区的提取结果较为稳健, 精度值都维持87%以上。综合来看, 利用本文方法对各传感器获取的遥感影像数据进行居民区提取取得了较好的效果和较高的精度。同时, 本文方法的计算效率也优于空间投票法。

图7 本文方法和空间投票法的精度对比Fig.7 Comparison between accuracy of our method and spatial voting

3 结论

1)针对高分辨率影像居民区的空间特征准确表达与使用, 计算出可有效刻画遥感影像空间相关性的数据场势值特征;

2)利用计算所得遥感影像的势值特征图像, 可增强分水岭分割效果, 对分割结果的形心点进行基于密度的聚类, 可较为准确地提取高分辨率遥感影像中的居民区;

3)与空间投票法的结果对比表明, 本文提出基于数据场和密度聚类的高分辨率遥感影像居民区提取方法的提取结果精度较高, 提取时间代价低, 居民区边缘特征保留较好, 且鲁棒性优于空间投票法。

由于高分辨率影像居民区中尚存在多种尺度且尺度差异较大的目标建筑, 利用分水岭方法对势值特征进行分割时, 大尺度目标分割所得结果的形心点不易满足聚类条件, 导致居民区内部分建筑物漏检, 因此, 如何改善漏检现象, 后续还需进一步深入研究。

The authors have declared that no competing interests exist.

参考文献
[1] Pesaresi M, Gerhardinger A, Kayitakire F. A robust built-up area presence index by anisotropic rotation-invariant textural measure[J]. IEEE Journal of Selected Topics in Applied Earth Observation and Remote Sensing, 2008, 1(3): 180-192. [本文引用:1]
[2] 沈小乐, 邵振峰, 田英洁. 纹理特征与视觉注意相结合的建筑区提取[J]. 测绘学报, 2014, 43(8): 842-847.
Shen X L, Shao Z F, Tian Y J. Built-up areas extraction by textural feature and visual attention mechanism[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(8): 842-847. [本文引用:1]
[3] Kovács A, Szirányi T. Improved Harris feature point set for orientation-sensitive urban-area detection in aerial images[J]. IEEE Geoscience and Remote Sensing Letters, 2013, 10(4): 796-800. [本文引用:1]
[4] 陈洪, 陶超, 邹峥嵘, . 利用边缘密度特征提取高分辨率遥感影像中的居民区[J]. 应用科学学报, 2014, 32(5): 537-542.
Chen H, Tao C, Zou Z R, et al. Extraction of built-up areas extraction from high-resolution remote-sensing images using edge density features[J]. Journal of Applied Sciences, 2014, 32(5): 537-542. [本文引用:1]
[5] Shi H, Chen L, Bi F K, et al. Accurate urban area detection in remote sensing images[J]. IEEE Geoscience and Remote Sensing Letters, 2015, 12(9): 1948-1952. [本文引用:1]
[6] 李德毅, 淦文燕, 刘璐莹. 人工智能与认知物理学[C]//中国人工智能学会第10届全国学术年会论文集. 北京: 北京邮电大学出版社, 2003: 6-15.
Li D Y, Gan W Y, Liu L Y. Artificial intelligence and cognitive physics[C]//Progress of Artificial Intelligence in China 2003. Beijing: BUPT Publishing House, 2003: 6-15. [本文引用:1]
[7] Li D Y, Wang S L, Gan W Y, et al. Data field for hierarchical clustering[J]. International Journal of Data Warehousing and Mining, 2011, 7(4): 43-63. [本文引用:1]
[8] 陈一祥. 高分影像空间结构特征建模与信息提取[D]. 武汉: 武汉大学, 2013.
Chen Y X. Modeling of Spatial Structural Features and Information Extraction for High Resolution Remote Sensing Images[D]. Wuhan: Wuhan University, 2013. [本文引用:1]
[9] Wu T, Qin K. Data field-based transition region extraction and thresholding[J]. Optics and Lasers in Engineering, 2012, 50(2): 131-139. [本文引用:1]
[10] 陶建斌, 舒宁, 沈照庆. 基于数据场聚类的遥感影像分类方法研究[J]. 国土资源遥感, 2008, 20(3): 20-23, 26. doi: 106046/gtzyyg. 2008. 03. 05.
Tao J B, Shu N, Shen Z Q. A study of the method for clssification of remote sensing images based on data field cluster[J]. Remote Sensing for Land and Resources, 2008, 20(3): 20-23, 26. doi: 10.6046/gtzyyg.2008.03.05. [本文引用:1]
[11] Gonzalez R C, Woods R E. Digital Image Processing[M]. 2nd ed. Upper Saddle River, NJ: Prentice Hall, 2002. [本文引用:1]
[12] Ester M, Kriegel H P, Sand er J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[C]//Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining. Portland : AAAI Press, 1996: 226-231. [本文引用:1]
[13] Sirmacek B, Unsalan C. Urban area detection using local feature points and spatial voting[J]. IEEE Geoscience and Remote Sensing Letters, 2010, 7(1): 146-150. [本文引用:1]