国土资源遥感, 2020, 32(4): 41-45 doi: 10.6046/gtzyyg.2020.04.06

技术方法

融合超像元与峰值密度特征的遥感影像分类

孙珂,

河南测绘职业学院,郑州 451464

Remote sensing image classification based on super pixel and peak density

SUN Ke,

Henan College of Surveying and Mapping, Zhengzhou 451464, China

责任编辑: 张 仙

收稿日期: 2019-12-12   修回日期: 2020-02-24   网络出版日期: 2020-12-15

Received: 2019-12-12   Revised: 2020-02-24   Online: 2020-12-15

作者简介 About authors

孙 珂(1985-),男,讲师,主要从事摄影测量与遥感、GIS方面的研究。Email:sunke_85@163.com

摘要

目前的高光谱影像分类算法多仅考虑光谱信息,为发挥高光谱影像空间信息和峰值密度聚类算法在划分遥感影像地物的优势,提出融合超像元与峰值密度特征的影像分类方法。充分利用超像元分割技术在高光谱影像空间信息和光谱信息,将高光谱影像分为超像元; 之后提取超像元灰度值作为峰值密度分类的重要特征; 然后筛选峰值密度最高的光谱作为整幅影像的光谱簇,视像元和超像元作为分类的基本单位; 进而分别获取像元、超像元与光谱簇间的差异,得到隶属度关系; 最后结合隶属度完成影像分类。通过实验验证,该方法在确保分类精度最高的条件下,较其他方法耗时相对较少,满足高光谱影像信息提取和分析的要求。

关键词: 高光谱遥感影像 ; 峰值密度 ; 超像元 ; 特征融合 ; 影像分类

Abstract

In order to give full play to the advantages of hyperspectral spatial information and peak density clustering algorithm in dividing remote sensing image features, this paper proposes a hyperspectral image classification method based on the combination of hyperpixel and peak density features. Superpixel segmentation technology makes full use of the spatial and spectral information of hyperspectral images, dividing hyperspectral images into hyperpixels, extracting the gray value of hyperpixels as an important feature of peak density classification, selecting the spectrum with the highest peak density as the spectral cluster of the whole image, using the visual and hyperpixels as the basic units of classification, and then obtaining the pixels and hyperpixels respectively. The membership relation is obtained by the difference between spectral clusters. Finally, the image classification is completed by combining the membership degree. Experiments show that the proposed algorithm takes less time than other methods under the condition of ensuring the highest classification accuracy, and meets the requirements of hyperspectral image information extraction and analysis.

Keywords: hyperspectral image ; peak density ; superpixel pixel ; feature fusion ; image classification

PDF (1929KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

孙珂. 融合超像元与峰值密度特征的遥感影像分类. 国土资源遥感[J], 2020, 32(4): 41-45 doi:10.6046/gtzyyg.2020.04.06

SUN Ke. Remote sensing image classification based on super pixel and peak density. Remote Sensing for Land & Resources[J], 2020, 32(4): 41-45 doi:10.6046/gtzyyg.2020.04.06

0 引言

高光谱影像数据具有高光谱分辨率、图谱合一的特点,其获取的数据构成一个三维数组,或称为影像立方体。高光谱遥感影像包含丰富的地物光谱特征和空间分布信息,是研究地物类型分布的重要参考依据。充分发掘高光谱影像的光谱信息与空间信息对反演地物类型、识别感兴趣目标等领域的研究十分重要。分类技术是替代传统人工目视解译的重要方法,可结合成熟的计算机技术快速准确反演及识别重要目标[1,2]

分类技术可分为监督分类和非监督分类[3,4]。监督分类中,训练样本的特征代表性是分类结果优劣的决定性因素。在实际应用中,针对数据获取训练程度较高的样本,需要结合数据的先验知识,考虑多方面因素筛选包含一定数量的、具有最大可分性优化的特征子集。非监督分类也称为分类分析,该方法避免分类样本的选取,通过设定合理的阈值来获得地表客观的分类结果。分类为解决目标探测、地物分类等问题提供良好的思路。分类算法将高光谱影像在连续 B个波段上的像元视为 B维空间上的点。提取高光谱影像在空间中的特征信息,筛选具有代表性的簇,作为影像地物类型的中心光谱,从而获取影像上每个基本分类单位相对每种地物中心光谱的隶属度。综上所述,分类是将高光谱影像分为若干个互斥非空子空间的集合。

峰值密度分类算法于2014年由Rodriguez等[5]提出,该算法筛选样本最大密度的点,把拥有最大密度同时又相距较远的点视为簇,构建样本和簇间的隶属度关系,将最大隶属度所代表的类别作为分类结果。该算法避免容易陷入局部解,利用已有的样本数据无需迭代即可求取全局最优解。因此,峰值密度分类算法在高光谱影像波段选择、影像分割等方面应用比较广泛。许毅平[6]提出将峰值密度聚类分割方法应用在高光谱影像上进行波段选取,将筛选的波段进行不同特征的归一化处理获取阴影相似图,最后通过聚类分割方法有效地提取影像上的阴影区域; 唐贵华[7]通过实验对比K-centers、近邻传播和峰值密度聚类等算法在高光谱遥感影像的波段选择效果,得出峰值聚类算法能够选择冗余信息、相关性少且分类准确率高的波段; Sun等[8]利用峰值密度聚类算法较好地分类出高光谱影像中的多种地物。但上述采用的算法对于数据量较大的高光谱影像而言,求解过程需计算任意样本点之间的距离造成较高的计算负担。

Ren等[9]在2003年提出超像素概念,通过一系列位置相邻且颜色、亮度、纹理等特征相似的像素点组成的小区域。常用的超像元分割算法有: 均值漂移算法[10]和简单线性迭代聚类[11](simple linear iterative clustering, SLIC)等。2011年,Ren等[12]提出的基于英伟达公司推出的统一计算设备架构(compute unified device architecture,CUDA)的图形处理器(graphics processing unit,GPU)并行加速SLIC,解决原始算法运算效率低的问题; 2013年,Kim等[13]提出了在迭代更新聚类中心过程中引入sigma滤波以克服原始SLIC算法迭代误差传播问题的改进SLIC; 2016年,Saranathan等 [14]在解决高光谱影像分类问题时,提出最小生成树的超像元分割方法。SLIC算法凭借线性算法复杂度,成为快速分类算法的预处理技术。其基于光谱和距离相似性,充分结合高光谱影像空间维度特征,为峰值密度聚类算法提供有价值的基本分类单位。

针对峰值密度聚类算法快速筛选全局最优簇,以及超像元分割算法充分结合影像空间信息,避免噪声干扰的优势。本文采用SLIC方法将高光谱影像分割为超像元,利用超像元代替像元作为峰值密度聚类算法的基本分类单位,筛选超像元在全局范围内的最优光谱簇。相对高光谱影像像元与簇间的隶属度,作为分类对象的高光谱影像分类算法(simple linear iterative clustering-peak density-pixel ,SLIC-DP-P)。提出以超像元作为分类对象的联合超像元与峰值密度特征的高光谱影像分类算法(simple linear iterative clustering-peak density-super pixel,SLIC-DP-SP)。并在此基础上,使用调整芮氏指标(adjusted rand index,ARI)评价SLIC-DP-SP算法相对SLIC-DP-P,K-Means和SLIC-KMeans算法在Pavia University高光谱数据集中,分类精度和处理效率方面所具有的优势。

1 基本原理

1.1 超像元分割算法

SLIC算法利用像元光谱的相似性和像元的面空间对像元进行聚类,从而有效地生成紧凑的统一化的超像素分割方法,为高光谱遥感影像的分类提供较好的分割结果。

假定存在 A个波段的高光谱遥感影像 {ri}i=1N,N为像素存在的总数; ri为第i个像素的光谱。初始运算时将原始影像的N个像元均匀分为 K个超像元 {wj}j=1K,因此每个超像元存在 N/K个像元。SLIC算法的分类函数为:

D=α+MSβ,
α=j=1A(rkj-tij)2,
β=(rx-tx)2+(ry-ty)2,

式中: α为像元间灰度差异; β为像元间坐标平面上的差异; S为相邻格网间的距离; M为超像元间的平衡参数,在本文的高光谱遥感影像聚类时取值范围为[1,20],超像元可获得较好的光谱相似性和空间近似性[11]; x为已知类别像元; y为未知类别像元; i为第i个像元; rkj为未知类别像元光谱值; tij为已知类别像元光谱值。同一地物局部区域光谱一致性较强,因此在分类中心3像元×3像元邻域中寻找像元光谱梯度最小的点,作为新的超像元种子点,迭代完成超像元分割,能有效地避免超像元的聚类中心落在噪声像元或边界点上的问题。最后,以超像元的灰度平均值 {wj}j=1K作为峰值密度分类算法的输入参数[11]

1.2 峰值密度聚类算法

峰值密度聚类算法主要在于聚类中心的确定,首先计算局部密度 ρi最大值,然后通过密度较大的点间距离 δi筛选簇。 widc 范围内的高斯核密度 ρi的计算公式为:

ρi=j=1,jiKe-dijdc2,
dij=wi-wj2,

式中: dij为平均灰度距离; wi为簇的可能性; dc为高斯核函数的权值参数,实际应用中对此阈值适度调整得到最优的分类精度[11]δi为样本点到更大密度点间的最小距离,即

δi=minj:ρi>ρj(dij)

密度 ρi和簇间距离 δi之间数值差异较大,因此把归一化后的 ρi~δi~,按式(4)得到选择参考指数 γ。对每个样本点来说, γ较大表明此点有较大密度的同时,距离其他更高密度点较远。参照 γ的排序,筛选数据的分类中心簇,即

γi=ρi~δi~

参照超像元的平均光谱 {wj}j=1K的选择参考指数 γi,筛选高光谱影像中包含 p个地物的类簇光谱 cm={rim}m=1p, (p<K), γi1γi2γipγiK。根据像元光谱 ri到类簇光谱 cm的距离,构建SLIC-DP-P算法的隶属度矩阵 U1=[U1im]N×p,即

U1im=ri-cm2

根据超像元光谱 wj到类簇光谱 cm的距离,构建SLIC-DP-SP算法的隶属度矩阵 U2=[U2im]K×p,即

U2im=wj-cm2

最后确定SLIC-DP-P和SLIC-DP-SP算法在高光谱影像中像元的类别标签 l1l2,即

l1i=argminm{U1im}m=1N,
l2i=argminm{U2im}m=1K

1.3 融合超像元与峰值密度特征的高光谱影像分类

为了充分利用高光谱影像的空间信息,同时降低影像的数据量,利用SLIC算法获得高光谱影像在光谱维度与空间维度上相似的像元合并为一个超像元,采用超像元的平均灰度值作为超像元的灰度值。然后采用峰值密度聚类方法筛选超像元光谱簇,更好地完成高光谱影像分类。

算法详细步骤如图1所示。首先,输入高光谱影像 {ri}i=1N,设定初始超像元个数K、紧密性系数M和DP算法参数阈值dc,通过SLIC算法获取超像元分割后的高光谱影像 {wj}j=1K; 然后,按照DP算法计算 {wj}j=1K筛选影像中 p个地物的类簇光谱 cm; 最后,参照高光谱影像像元光谱 ri、超像元光谱 wj到类簇光谱 cm的距离构建隶属度矩阵 U1U2,确定高光谱影像分类结果的类别标签 l1l2,完成影像分类。

图1

图1   SLIC-DP算法操作步骤

Fig.1   Operation steps of SLIC-DP algorithm


本文根据DP算法筛选出的全局最优簇,对比针对像元分类的SLIC-DP-P算法和针对超像元分类的SLIC-DP-SP算法较传统分类算法在分类精度和处理效率所具有的优势。因SLIC-DP-P和SLIC-DP-SP算法和其他传统分类算法的数学模型有较大不同,本文仅对比两者与K-Means和SLIC-KMeans之间的算法精度,以说明SLIC和DP算法在高光谱影像分类中的优势。

2 实验分析与讨论

2.1 实验设计

本文采用真实高光谱影像Pavia University数据集对SLIC-DP算法进行验证(图2)。实验的目标包括2个方面: ①SLIC-DP-SP算法与SLIC-DP-P,K-Means和SLIC-KMeans进行对比,通过ARI评价分类精度; ②统计算法分类所消耗的时间,推断算法的处理效率。分类算法仅能获得像元类别,但并不确定此类别代表的含义及类别间具有的联系或区别。ARI指标可评判算法分类结果精度。为使实验在相对公平的环境下进行,K-Means算法的初始分类中心相同,算法结果取20次实验后的中值。实验均在硬件配置中央处理器(central processing unit,CPU) Intel i5-4150,内存4 GB; 软件配置VS 2010的条件下进行。

图2

图2   高光谱影像Pavia University数据集

Fig.2   Hyperspectral image Pavia University data set


2.2 分类算法精度

K-Means,SLIC-KMeans,SLIC-DP-P和SLIC-DP-SP分类算法对Pavia University 的分类结果如图3所示。表1统计了各算法分类精度和计算时间。对照表1,在Pavia University数据集中,SLIC-DP-SP分类算法相对其他分类算法得到最优精度,ARI达到0.468,精度分别超出K-Means,SLIC-KMeans,SLIC-DP-P分类方法30%,24.47%和2.63%。上述数据表明,传统K-Means算法的分类效果较差,在经过SLIC算法的空间平滑效果后,有助于去除高光谱影像中干扰像元对分类结果的影响; 同时,DP算法在全局范围内筛选的最优光谱簇,其分类效果明显优于K-Means算法迭代所提取的次优解; 在隶属度矩阵构建过程中,为获取更优的分类效果,超像元显然比像元更适宜作为与簇间建立隶属度关系的对象。以上数据说明SLIC-DP-SP算法充分利用高光谱影像的空间信息,并在全局范围内利用高光谱影像丰富的光谱信息,筛选出具有最大可分性特征的地物类别光谱簇,确立超像元作为算法隶属度关系制定的对象,进而达到较为理想的分类效果。

图3

图3   Pavia University数据集分类结果

Fig.3   Classification results of Pavia University data set


表1   算法分类精度和计算时间

Tab.1  Classification accuracy and calculation time of algorithm

算法ARI时间/s
K-Means0.3602.024
SLIC-KMeans0.37620.290
SLIC-DP-P0.45619.703
SLIC-DP-SP0.46816.867

新窗口打开| 下载CSV


2.3 算法处理效率

在算法需要具备较为优秀的求解精度时,消耗时间越短,意味着算法处理问题的效率相对较高。从表1可以看出,在Pavia University数据集中,K-Means的处理时间最短,但算法的精度最差; 而SLIC-KMeans算法的精度较K-Means高,却多消耗10倍的时间,说明SLIC算法利用空间平滑效果去除噪声像元的效果较好,但算法效率需要优化提高; 引入DP算法之后,因DP算法在全局范围内求取最优解,没有迭代过程。因此,SLIC-DP-P算法在精度提升的前提下,较SLIC-KMeans降低2.89%的算法运行时间。可见DP算法效率较高,耗时较少; 将超像元替代像元作为隶属度关系制定的对象后,SLIC-DP-SP算法较SLIC-DP-P算法来说,精度提升,且消耗时间降低了14.39%。说明以超像元为分类对象后,排除噪声像元对分类结果的影响,提升了分类结果的精度; 而较像元来说,超像元的数量因结合高光谱影像的空间信息而大幅度降低,一定程度上减轻了算法的运算负担。

2.4 算法参数评估

SLIC-DP-SP算法一共有3个参数。分别为: 初始超像元个数 K、紧密性系数 M和DP算法参数阈值dc。初始超像元个数 K决定SLIC算法初始种子点位置,随着算法迭代过程,高光谱影像分为光谱相近、空间相邻且互斥的超像元集合。从图3(b)SLIC分割结果看出,最理想的分割是把沿参考数据的地物边界,在空间、光谱维度上依照最大特征分割。若 K太低,造成初始种子点分布不均匀,不能良好地落在参考数据感兴趣地物中,势必造成分割结果不充分; 另一方面,若 K太高,使得同一块感兴趣地物被过多地分割成多个超像元,则有可能造成超像元的“同物异谱”现象,为后续DP算法筛选最优光谱簇造成困难,引发分类错误。总的来说, K的选择需要保证一定数量的同时不过多划分影像区域。经多组实验对比,本文初始超像元个数 K=200M对分类精度影响不大,但过分考虑超像元的M,会降低算法的运行效率。一般来说, M=10能满足一般应用需求。 dc的确定较为复杂,原因是在高光谱影像超像元光谱形成的高维空间内,无法保证所有类别的光谱分布呈“理想球形”,并且类别间光谱“点云”之间可能存在交叉重叠。因此, dc不仅要最大程度地使不同类别间地物光谱在高维空间上拥有最大可分性; 而且要避免同类别光谱被过分地分为多个簇。

综上所述,SLIC-DP-SP算法的参数确定原因复杂,参数在不同数据上所呈现的特征不同,参数之间又存在相互制约的关系。在实际应用中,需要做到具体数据具体分析。尽可能地保证算法获得最优分类结果。SLIC算法和DP算法的收敛性已经得到证明[8]

3 结论

1)本文针对高光谱影像分类方法存在空间信息利用不足,提出融合超像元与峰值密度特征的高光谱影像分类(SLIC-DP-SP)算法。

2)该算法利用SLIC算法提取平均光谱,去除部分噪声像元对分类的影响; 在此基础上,发挥DP算法求取全局范围内优化分类簇,从而避免分类算法迭代降低算法效率; 最终选定超像元作为分类对象,进一步提升分类效果。

3)通过真实高光谱影像数据集进行对比分析,本文算法较K-Means,SLIC-KMeans和SLIC-DP-P方法分类精度分别提高30%,24.47%和2.63%,验证了本文算法的精度优势。

参考文献

崔宾阁, 吴亚男, 钟勇.

高光谱图像滚动引导递归滤波与地物分类

[J]. 遥感学报, 2019,23(3):431-442.

[本文引用: 1]

Cui B G, Wu Y N, Zhong Y.

Rolling guided recursive filtering and feature classification of hyperspectral images

[J]. Journal of Remote Sensing, 2019,23(3):431-442.

[本文引用: 1]

龚希, 吴亮, 谢忠, .

融合全局和局部深度特征的高分辨率遥感影像场景分类方法

[J]. 光学学报, 2019,39(3):19-29.

[本文引用: 1]

Gong X, Wu L, Xie Z, et al.

Classification method of high-resolution remote sensing scenes based on fusion of global and local deep features

[J]. Acta Optica Sinica, 2019,39(3):19-29.

[本文引用: 1]

谷雨, 徐英, 郭宝峰.

融合空谱特征和集成超限学习机的高光谱图像分类

[J]. 测绘学报, 2018,47(9):1238-1249.

[本文引用: 1]

Gu Y, Xu Y, Guo B F.

Hyperspectral image classification by combination of spatial-spectral features and ensemble extreme learning matchines

[J]. Acta Geodaetica et Cartographica Sinica, 2018,47(9):1238-1249.

[本文引用: 1]

陈洋, 范荣双, 徐启恒, .

结合光谱相似和相位一致的高分辨率影像分类

[J]. 测绘科学, 2018,43(11):142-146.

[本文引用: 1]

Chen Y, Fan R S, Xu Q H, et al.

A high resolution image classification method considering spectral similarity and phase consistency

[J]. Science of Surveying and Mapping, 2018,43(11):142-146.

[本文引用: 1]

Rodriguez A, Laio A.

Clustering by fast search and find of density peaks

[J]. Science, 2014,344(6191):1492-1496.

DOI:10.1126/science.1242072      URL     PMID:24970081      [本文引用: 1]

Cluster analysis is aimed at classifying elements into categories on the basis of their similarity. Its applications range from astronomy to bioinformatics, bibliometrics, and pattern recognition. We propose an approach based on the idea that cluster centers are characterized by a higher density than their neighbors and by a relatively large distance from points with higher densities. This idea forms the basis of a clustering procedure in which the number of clusters arises intuitively, outliers are automatically spotted and excluded from the analysis, and clusters are recognized regardless of their shape and of the dimensionality of the space in which they are embedded. We demonstrate the power of the algorithm on several test cases.

许毅平.

基于高光谱图像多特征分析的目标提取研究

[D]. 武汉:华中科技大学, 2008.

[本文引用: 1]

Xu Y P.

Study on object extraction based on multi-feature from hyperspectral image

[D]. Wuhan:Huazhong University of Science and Technology, 2008.

[本文引用: 1]

唐贵华.

基于密度排序聚类和超像素分割的高光谱遥感影像降维方法研究

[D]. 深圳:深圳大学, 2016.

[本文引用: 1]

Tang G H.

Ranking-based-clustering and superpixel segmentation for hyperspectral remote imagery dimensionality reduction

[D]. Shenzhen:Shenzhen University, 2016.

[本文引用: 1]

Sun X, Yang L, Gao L, et al.

Hyperspectral image clustering method based on artificial bee colony algorithm and Markov random fields

[J]. Journal of Applied Remote Sensing, 2015,9(1):095047.

[本文引用: 2]

Ren X, Malik J.

Learning a classification model for segmentation

[C]// Proceedings of Ninth IEEE International Conference on Computer Vision, 2003.

[本文引用: 1]

方旭, 王光辉, 杨化超, .

结合均值漂移分割与聚类分析的遥感影像变化检测

[J]. 测绘通报, 2017(12):68-71.

[本文引用: 1]

Fang X, Wang G H, Yang H C, et al.

Remote sensing imageries change detection combined with mean-shift segmentation and cluster analysis

[J]. Bulletin of Surveying and Mapping, 2017(12):68-71.

[本文引用: 1]

Achanta R, Shaji A, Smith K, et al.

SLIC superpixels compared to state-of-the-art superpixel methods

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012,34(11):2274-2282.

DOI:10.1109/TPAMI.2012.120      URL     PMID:22641706      [本文引用: 4]

Computer vision applications have come to rely increasingly on superpixels in recent years, but it is not always clear what constitutes a good superpixel algorithm. In an effort to understand the benefits and drawbacks of existing methods, we empirically compare five state-of-the-art superpixel algorithms for their ability to adhere to image boundaries, speed, memory efficiency, and their impact on segmentation performance. We then introduce a new superpixel algorithm, simple linear iterative clustering (SLIC), which adapts a k-means clustering approach to efficiently generate superpixels. Despite its simplicity, SLIC adheres to boundaries as well as or better than previous methods. At the same time, it is faster and more memory efficient, improves segmentation performance, and is straightforward to extend to supervoxel generation.

Ren C Y, Reid I.

gSLIC:A real-time implementation of SLIC superpixel segmentation

[R]. Oxford:University of Oxford,Department of Engineering, 2011.

[本文引用: 1]

Kim K S, Zhang D, Kang M C, et al.

Improved simple linear iterative clustering superpixels

[C]// IEEE International Symposium on Consumer Electronics. IEEE, 2013.

[本文引用: 1]

Saranathan A M, Parente M.

Uniformity-based superpixel segmentation of hyperspectral images

[C]// IEEE Transactions on Geoscience and Remote Sensing. IEEE, 2016,54(3):1419-1430.

[本文引用: 1]

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发