第一作者简介: 陈 军(1978-),男,博士研究生,主要研究方向为全极化合成孔径雷达遥感图像处理、机器学习在遥感图像分析中的应用。Email: studyias@163.com。
针对H/Alpha/A-Wishart非监督分类算法存在的未充分提取SAR图像极化信息和分类精度低等问题,引入多分量散射模型(multiple-component scattering model,MCSM)分解,提出了一个适用于全极化SAR图像非监督分类的MCSM-Wishart算法。首先对全极化SAR图像进行MCSM分解,提取体散射、二次散射、螺旋体散射、表面散射和线散射极化信息,采用迭代自组织数据分析技术(iterative self-organizing data analysis technique,ISODATA)的非监督分类算法进行聚类; 然后通过基于描述多视协方差矩阵的复Wishart分布的迭代分类得到分类结果。以南京溧水和盐城滨海湿地的ALOS PALSAR图像为研究数据,比较了H/Alpha-Wishart算法、H/Alpha/A-Wishart算法、MCSM-Wishart算法和监督-Wishart算法4种分类方法。研究结果表明,MCSM-Wishart分类算法在效率、总体准确率和Kappa系数等指标上均较原始分类器有一定的提高; 将ISODATA聚类算法应用于复Wishart分布的迭代分类器中,可有效提高分类的精度。
To tackle the problems of insufficiently extracting polarimetric information from PolSAR image and low classification accuracy of H/Alpha/A-Wishart unsupervised classification algorithm, this paper proposes an adapted algorithm named MCSM-Wishart by imposing multiple-component scattering model (MCSM)decomposition to fit unsupervised classification of polarimetric SAR image. Firstly, various kinds of polarimetric information such as volume scatter, double scatter, helix scatter, surface scatter and wire scatter can be extracted from the image by MCSM decomposition, and iterative self-organizing data analysis(ISODATA)technique is used for clustering. Then iterative classification based on complex Wishart distribution is used to obtain the final result. H/Alpha-Wishart, H/Alpha/A-Wishart, MCSM-Wishart and supervised-Wishart algorithms are compared with each other based on two research plots conducted respectively in Lishui of Nanjing City and Binhai Wetland of Yancheng City with PALSAR image from ALOS. The results show that MCSM-Wishart classification algorithm can improve to a certain extent the original classifiers in terms of efficiency, total accuracy and Kappa coefficient. It is therefore concluded that the polarimetric information extracted by MCSM decomposition can sufficiently reflect the characteristics of the ground object. Combining with ISODATA clustering algorithm, MCSM decomposition can be used in the iterative classification based on complex Wishart distribution so as to improve the classification accuracy and reliability efficiently.
全极化合成孔径雷达(polarimetric synthetic aperture Radar, PolSAR)系统是在传统的单极化、双极化和多极化雷达系统基础上发展起来的新型主动微波成像系统, 如何通过全极化SAR系统提供的极化信息对地物进行分类已成为全极化SAR图像应用的一个重要方面[1]。传统的单极化和多极化SAR图像处理通过提取纹理信息、极化信息等进行分类, 然而, 无论单极化还是多极化SAR系统获取的都是部分极化信息; 而全极化SAR系统包含同极化、交叉极化等不同的极化信息, 可以全面反映地物目标的物理性质。
国内外学者在全极化SAR图像极化特征提取方面开展了大量研究[2, 3, 4, 5, 6, 7]。利用极化分解获得的特征可以对全极化SAR图像进行分类[8, 9, 10, 11, 12, 13, 14, 15]。Lee等[8]首先用H/Alpha分解法提取的特征对图像进行初始聚类, 得到8个聚类中心; 然后用描述多视协方差矩阵的复Wishart迭代分类器对图像进行分类(简称H/Alpha-Wishart分类器)。Pottier等[9]提出了H/Alpha/A-Wishart分类器, 在H/Alpha分解的基础上加入A特征, 将图像聚成16类, 再对图像进行复Wishart迭代分类。Lee等[10]进一步结合Freeman分解法对上述方法进行改进, 提出Freeman-H/Alpha-Wishart分类器, 该分类器通过Freeman分解提取体散射、表面散射和二次散射信息, 然后根据H/Alpha/A-Wishart分类器进行分类, 分类中要求各类别必须保持纯净性(即各类别内部各像元必须基于相同的散射性质), 必须是体散射、表面散射或二次散射中的一种, 该分类器已经隐含参考Freeman分解进行分类, 但并没有直接利用Freeman分解得到的特征, 而是简单地要求分类结果必须具有相同的散射性质, 因此还具有一定局限性。
无论H/Alpha-Wishart分类器、Freeman-H/Alpha-Wishart分类器或者H/Alpha-SPAN[11]分类器, 其分类结果均明显依赖于H/Alpha初始聚类结果, 导致最终分类精度不高。针对这一问题, 本文提出一种改进的分类方法, 该方法充分利用了全极化SAR图像的表面散射、体散射、二面角散射、螺旋体散射和线散射等极化特征, 在没有人工干预的情况下能够得到较好的聚类结果。
1.1.1 H/Alpha/A分解与初始聚类
H/Alpha/A分解主要是提取全极化SAR图像的散射熵H、散射角α (即Alpha, 下同)和反熵A信息。其基本原理如下:
极化相干矩阵T可以表示为3个独立的相干矩阵之和[2], 即
T=
式中: λ i为特征值(i=1, 2, 3); ei为矩阵T的第i个复特征向量;
在此基础上, Cloude等[2]定义了熵H, 用于表示地物散射的随机程度, 即
H=
式中Pi为各特征值所占的百分比, 即
Pi=λ i/
散射角α 代表二面角散射和表面散射的平均散射程度, 即
反熵A表示优势散射以外的较弱散射分量间的关系[9], 即
A=(λ 2-λ 3)/(λ 2+λ 3) 。 (5)
根据H和α 的不同取值, 即可确定图像每个像元在H/Alpha平面(图1)中的位置, 从而将像元归入8个不同的类别; 对每个类别取平均操作, 得到初始聚类结果。加入A后, 设置1个阈值, 可以得到16个不同的类别。
1.1.2 基于复Wishart分布的极大似然分类
以1.1.1节初始聚类结果作为中心, 进行基于复Wishart分布的极大似然分类。其原理[8]如下:
极化协方差矩阵的概率密度分布函数服从n个自由度的复Wishart分布, 其分布函数PT为
其中
K(n, q)=π (1/2)q(q-1)Γ (n)…Γ (n-q+1) , (7)
式中: n为视数; q代表不同的极化方式, 在互易性情况下, q=3; Tr为矩阵的迹; C为极化协方差矩阵; ∑ =E(C); K为归一化因子; Γ (· )为Gamma函数。对矩阵进行线性变换可以得到极化相干矩阵T。因此, 极化相干矩阵的概率密度分布函数也服从n个自由度的复Wishart分布。
进一步对图像进行开窗操作, 计算窗口内所有像元的平均极化相干矩阵; 然后分别求该矩阵与8个类别中心的距离[8], 即
dist(T|∑ i)=ln|∑ i|+Tr(∑
式中: ∑ i为第i个类别中心的极化相干矩阵; T为窗口内所有像元极化相干矩阵的均值矩阵。比较8个距离, 将像元归为距离最小的那一类。
本研究从2个方面优化初始聚类效果: ①引入MCSM分解对全极化SAR图像进行极化分解, 提取表面散射、二次散射、体散射、螺旋体散射和线散射等更为全面的基本散射信息作为特征, 解决仅使用H, α 和A特征进行初始聚类的不足; ②使用聚类效果更好的ISODATA聚类算法代替图1中的简单聚类算法, 以提高初始聚类精度。
MCSM分解的极化协方差阵[6]为
C=fsCsurface+fdCdouble+fvCvolume+fhChelix+fwCwire
=fs
fw
式中: fs, fd, fv, fh和fw分别为表面(surface)散射、二次(double)散射、体(volume)散射、螺旋体(helix)散射和线(wire)散射系数; α , β , γ 和ρ 为未知数; α * , β * , γ * 和ρ * 分别为α , β , γ 和ρ 的共轭。求解式(9), 即可得到各散射系数及α 和β 的值; γ 和ρ 可以通过下式求解[6], 即
式中SHH, SVV, SHV和SVV分别表示极化方式为HH, VV, HV和VV的散射矩阵。
根据各散射成分的系数, 即可计算各散射功率的值, 计算公式[6]为
式中: Ps为表面散射功率; Pd为二次散射功率; Pv为体散射功率; Ph为螺旋体散射功率; Pw为线散射功率。
对极化协方差矩阵进行线性变换可以得到极化相干矩阵。因此, 极化相干矩阵同样可以通过MCSM分解得到以上各散射成分的系数。从当前极化目标分解算法的发展和评述来看, MCSM分解的方法能充分提取出各种自然和人工地物的各种散射成分的信息, 将这些信息作为特征向量可以较全面地反映图像的物理性质[16]。
ISODATA是一种运行速度较快、可以自动合并和分裂聚类结果的非监督分类或聚类方法。与K-means聚类算法相比, ISODATA可以进行类别的合并和分裂, 灵活性较好, 聚类结果更为合理。大量实验分析表明, ISODATA聚类具有算法实现简单、运算速度快、聚类效果较好等特点。
传统的ISODATA聚类算法多采用欧式距离计算样本与聚类中心的距离。但考虑到极化数据不同于光学数据的概率分布, 本文对比欧式距离和马氏距离后, 采用马氏距离进行距离计算, 即
Dm(t)=
式中样本si与中心mj分别为
si=[si1si2 … sin]T , (13)
mj=[mj1mj2 … mjn]T , (14)
改进MCSM-Wishart分类器的核心思想是: ①引入MCSM分解对图像进行极化分解, 提取表面散射、二次散射、体散射、螺旋体散射和线散射等更为全面的基本散射信息作为特征; ②使用聚类结果更好的ISODATA算法。因此, MCSM-Wishart分类器的改进主要包括4个部分: 图像预处理、极化特征的提取、初始聚类结果的生成和复Wishart分布的迭代分类。具体分类步骤如下:
1)数据预处理。读入全极化SAR图像, 进行多视处理, 按照通用方法将多视比设为7∶ 1。设置滤波窗口大小为7像元× 7像元, 进行Refined Lee滤波, 得到图像的极化相干矩阵T。
2)MCSM分解。设置的窗口大小与步骤1)保持一致, 对极化相干矩阵T进行MCSM分解, 提取表面散射、二次散射、体散射、螺旋体散射和线散射等多种散射成分, 将其组合成特征向量, 用以表征极化信息。
3)ISODATA初始聚类。设置ISODATA聚类算法的初始条件(最小、最大类别等), 对步骤2)产生的特征向量进行迭代聚类, 生成初始聚类结果。
4)计算聚类中心。在各聚类内部进行平均操作, 计算出初始聚类中心。
5)计算距离并聚类。选择步骤4)生成的聚类中心, 设置循环条件, 进行基于复Wishart分布的迭代分类; 根据式(8)计算图像内所有像元到各聚类中心的距离, 将像元归入距离最小的类别。
6)判断是否满足循环终止条件, 若不满足, 返回步骤4)继续进行计算; 否则, 完成分类。
为验证本文算法, 选择南京溧水和盐城滨海研究区2景ALOS的1.1级PALSAR(phased array L-band SAR)图像(全极化方式)的子图像为数据源进行实验。2景图像的获取时间分别为2011年3月22日和2009年4月9日。其中, 研究区1(南京溧水)图像大小为400像元× 400像元, 研究区2(盐城滨海)图像大小为500像元× 500像元。研究区内包括水体、建筑物、耕地、林地和道路等地物类型。实验结果采用目视解译数据和Google Earth图像, 通过综合对比的方法确定测试样例, 进行精度评价。研究区1的Google Earth图像成像时间为2013年4月10日; 研究区2的TM图像成像时间为2010年4月29日。2个研究区均属县级行政单位下的乡镇地区, 全极化SAR图像、TM图像和Google Earth图像在获取时间间隔内土地利用变化较小, 因此虽然在时相上有一定差距, 但仍具有参考价值。
实验采用的处理软件为POLSARPro(the polarimetric SAR data processing and educational tool)软件, 数据预处理包括多视处理、滤波和极化特征分解等, 传统H/Alpha/A-Wishart分类算法及监督-Wishart分类算法采用该软件自带的功能, 改进算法采用C语言实现。
研究区1和研究区2的Pauli基分解[1](极化校准)及假彩色合成图像如图2所示。
首先进行图像预处理工作, 包括多视、滤波和极化特征分解。对图像进行多视处理, 多视比设为7∶ 1; 对多视处理后的图像进行窗口大小为7像元× 7像元的Refined Lee滤波处理; 通过MCSM分解提取出各种散射成分。然后进行初始聚类, ISODATA算法设置的初始条件为: 最小类别为8, 最大类别为12, 类内最小个数为2, 类间最小距离为4, 最大迭代次数为20, 最大类标准差为1。通过聚类结果计算聚类中心, 最后进行复Wishart分类, 得到分类结果。
作为对比, 本文还分别进行了H/Alpha-Wishart和H/Alpha/A-Wishart算法的非监督分类实验, 并选择训练样本进行了监督-Wishart分类实验。其他分类器如Freeman-H/Alpha-Wishart, H/Alpha-SPAN等的分类精度与H/Alpha/A-Wishart分类器的分类精度相似。为便于研究, 仅以H/Alpha-Wishart和H/Alpha/A-Wishart算法进行实验。为便于比较分类结果, 结合训练样本和监督分类结果对非监督聚类后的结果进行了类别合并(图3和图4)。
从图3(a)可以看出, 在研究区1, 原H/Alpha-Wishart算法将水体和耕地混分。原因在于, 当水体面积较少时, H/Alpha分解提取出的特征不足以反映地物的极化性质, 因此影响了最终的精度。虽然对H/Alpha/A-Wishart算法有所改善, 但整体精度仍低于改进后的MCSM-Wishart算法精度。通过对比图3(b)与图3(c)可以看出, 在研究区1, H/Alpha/A-Wishart算法存在耕地和林地混分、林地和建筑物混分的情况, 而MCSM-Wishart算法则较少存在以上混分现象。另外, MCSM-Wishart算法提取出的水体也多于H/Alpha/A-Wishart算法, 这是因为, MCSM算法提取出了更多的极化特征用于分类。
对比图4(a)(b)(c)可以看出, 在研究区2, H/Alpha-Wishart和H/Alpha/A-Wishart算法均不同程度地存在建筑和道路混分、道路和水体混分的情况; 而MCSM-Wishart算法则能较好地区分出建筑、道路和水体, 图4下部的水体中混有道路的情况得到了改善, 图4右上部的建筑物中混有道路的情况得到改进。主要原因是MCSM方法提取出了螺旋体散射、线散射等较多的能反映城市地区地物类型的特征, 因此能较好地对城市及周边的不同人造地物进行类别划分。
为比较各算法的分类精度, 结合Google Earth图像、TM图像对2个研究区进行人工采样, 手工选择了各种地物类型的测试样本如表1所示。
![]() | 表1 测试样本 Tab.1 Test samples(像元) |
4种算法的分类精度见表2。
![]() | 表2 4种算法的分类精度 Tab.2 Classification results of four kinds of algrithm |
从表2可以看出, 无论研究区1还是研究区2, MCSM-Wishart算法的分类精度均有较大提升, 分别比H/Alpha/A-Wishart算法提高了4.22%和11.81%; Kappa系数则分别提高了0.05和0.16。
与监督-Wishart算法相比, MCSM-Wishart算法精度稍差, 说明极化特征提取方法还有需要完善之处。4种算法的执行效率见表3。
![]() | 表3 4种算法的执行效率 Tab.3 Efficiency of four kinds of algorithm(s) |
从表3中4种算法的运行时间来看, MCSM-Wishart算法效率高于H/Alpha/A-Wishart算法。虽然监督-Wishart算法需要的时间更短, 但这个时间并未包含选择训练样本的时间、也没有考虑训练样本选择的实际困难。因此总的来看, MCSM-Wishart算法是一种有效的非监督分类算法。
综上所述, 无论总体精度、Kappa系数还是运行效率, MCSM-Wishart算法均较H/Alpha-Wishart算法和H/Alpha/A-Wishart算法有了明显的提高。
1)经典的全极化SAR图像非监督分类主要以H/Alpha/A分解提取的极化特征为基础进行图像分类, 但总体分类精度往往较低, 不能满足应用要求。造成这种情况的原因是多方面的, 如该分解法并不能完全提取反映全极化SAR图像的全部特征, 选择的分类器并不能很好地对图像进行分类等。
2)引入MCSM算法是提高全极化SAR图像分类准确性的有效途径之一。本文在传统的极化信息提取基础上, 引入多极化特征提取的MCSM算法, 全面提取出反映城市地物类型的极化特征; 然后通过改进的聚类算法进行初始聚类, 以此为基础对原H/Alpha/A-Wishart分类器进行改进。
3)以ALOS的PALSAR图像为遥感数据源进行综合分类实验的结果表明, 改进的MCSM-Wishart分类算法较经典的H/Alpha/A-Wishart分类器在分类精度、Kappa系数、算法效率等指标上均有很大的提高。因此, 提取全极化SAR图像的线散射等极化特征, 然后与二次散射、表面散射和螺旋体散射等经典的极化特征相结合, 辅以速度快、精度高的ISODATA聚类算法, 可以有效地提高全极化SAR图像分类的精度。
4)下一步的研究将充分考虑从全极化SAR图像中提取其他的特征(如纹理和空间几何信息等), 并将其与极化特征相结合, 对H/Alpha/A-Wishart分类器作进一步改进。
志谢: 感谢欧洲空间局提供开源软件POLSARPro。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|