高光谱数据非监督分类的改进独立成分分析方法
李娜, 赵慧洁
北京航空航天大学仪器科学与光电工程学院,北京 100191

第一作者简介: 李 娜(1978-),女,讲师,主要从事高光谱数据建模与应用处理方面的研究。

摘要

利用数据本身统计特性是实现高光谱数据非监督分类的有效方法之一。针对利用高光谱数据一阶、二阶统计量不能完全表征数据结构的问题,提出了一种基于数据高阶统计特性——峭度的改进独立成分分析方法(Improved Kurtosis-Based Independent Component Analysis,IKICA)的高光谱数据非监督分类方法,并针对利用峭度进行非高斯性度量时对噪声等敏感的问题进行了模型改进。利用同一航带的OMIS高光谱遥感数据对该算法的性能进行了评价,并分别与基于最大似然估计和基于负熵的独立成分分析(ICA)方法进行了性能比较。将该方法应用于PHI获取的方麓茶场航空高光谱数据的非监督分类,结果表明,本文提出的算法明显地提高了运算的收敛速度和鲁棒性,并具有较高的分类精度和较强的抗噪声能力。

关键词: 高光谱遥感; 独立成分分析; 峭度; 非监督分类
中图分类号:TP751.1 文献标志码:A 文章编号:1001-070X(2011)02-0070-05
An Improved Independent Component Analysis Method for Unsupervised Classification of Hyperspectral Data
LI Na, ZHAO Hui-jie
School of Instrument Science and Opto-electronics Engineering, Beihang University, Beijing 100191, China
Abstract

To solve the problem that the first-order and second-order statistics may be inadequate for obtaining a complete representation of the data,a high-order statistics-based method, kurtosis-based independent component analysis (KICA),is introduced to implement unsupervised classification of hyperspectral data. Aimed at the purpose that kurtosis can be very sensitive to outliers such as noise,the improved KICA (IKICA) model is proposed in the work when kurtosis is used as optimization criterion for the ICA problem. To evaluate the performance of the proposed algorithm and its application capability in unsupervised classification, IKICA is compared with maximum likelihood-based ICA and negentropy-based ICA,and the synthesized and real hyperspectral data acquired by Object Modularization Imaging Spectrometer (OMIS) and Pushbroom Hyperspectral Imager (PHI) are used. The results show that convergence speed and robustness are enhanced obviously and anti-noise capability is improved in the authors’ work. The application result has high precision of classification.

Keyword: Hyperspectral remote sensing; Independent component analysis(ICA); Kurtosis; Unsupervised classification
0 引言

在遥感应用领域, 利用遥感图像实现地物分类是一项非常重要的工作。高光谱遥感数据同时提供地表地物丰富的空间、辐射和光谱三重信息, 利用这些信息可以实现地物的定量化检测和识别。因此, 高光谱遥感的出现和发展为开展地物理化特性的深层探索、进行地物间微小差异的精细识别, 提供了强有力的探测手段和前所未有的丰富信息。但如何将高光谱数据所包含的丰富信息充分挖掘出来, 则需要适合于该类数据的处理方法和技术。这正是当前高光谱遥感科学工作者迫切需要解决的难题之一[1]

非监督分类在没有任何先验信息的情况下, 根据图像本身的统计特征以及自然点群的分布情况确定分类判别准则进行分类。非监督分类方法快速、简单且具有一定的分类精度, 可以作为监督分类的重要补充手段, 对监督分类结果进行修改和调整。非监督分类方法包括K均值、ISODATA、动态聚类、分裂法、平行六面体分类法和模糊聚类等, 但是该类方法主要利用数据的一阶或二阶统计量作为类别统计特征, 然而一阶和二阶统计量不能完全表征高光谱数据的结构[2], 从而导致分类精度下降。因此, 在高光谱遥感数据分类中需要利用数据的高阶统计特性。

本文引入了一种基于峭度的改进独立成分分析(Improved Kurtosis-based on Independent Component Analysis, IKICA)的高光谱数据非监督分类方法, 该方法利用图像数据本身的高阶统计量— — 峭度进行高光谱数据的非高斯性度量, 并引入最小化噪声变换方法抑制噪声等对模型分类效果的影响; 同时利用OMIS高光谱遥感数据进行算法性能的评价, 并分别与基于最大似然估计和基于负熵的独立成分分析(Independent Component Analysis, ICA)方法进行了比较。结果表明, 本文提出的算法在明显地提高了运算的收敛速度和鲁棒性的同时, 还提高了分类精度。最后将该方法应用于航空高光谱成像仪PHI获取的方麓茶场数据的分类, 取得了总体分类精度为91.68%、Kappa系数为0.901的分类结果。

1 基于峭度的改进ICA

ICA是近几年发展起来的一种基于信号高阶统计特性的独立成分分析方法[3], 其目的是对观察得到的数据进行某种线性分解, 使其分解成统计独立的成分。正是由于这一特点, 使ICA在信号处理领域受到了密切关注, 并得到了成功应用。随着对ICA研究的不断深入, 其在高光谱遥感领域也得到了广泛关注[4, 5, 6]。目前, 对ICA的研究主要分为两大类, 即基于信息论准则的迭代估计方法和基于统计学的代数计算方法[6]。基于信息论的方法主要从最小化互信息、最大似然和最大化负熵等角度提出了一系列的估计算法; 基于统计学的方法则主要利用三阶累积量、四阶累积量等高阶累积量的计算方法。从原理上讲, 这两种方法都是利用了源信号的独立性和非高斯性。

ICA是一种产生统计独立成分的多元变量数据分析方法, 在利用其进行地物分类时, 每一类别作为独立成分表示出来, 因此得到了类别的可分离性最大化。本文采用基于峭度的非高斯度量方法, 并针对峭度等高阶统计特性对噪声敏感的问题提出了IKICA非监督分类方法。

1.1 峭度— — 非高斯性度量

根据统计论中的中心极限定理— — 一组独立随机变量和的分布比任何源信号更接近于高斯分布, 可以将非高斯性作为随机信号相互独立的度量。为了在ICA模型[7]估计中采用非高斯性, 必须对一个随机变量(比如说y)的非高斯性定义一个定量化的指标。峭度(或称四阶累积量)是一种经典的非高斯性度量指标, 这主要是因为峭度在理论和计算上简单, 且易于实现。随机变量的峭度一般定义为

kurt(y)=E{y4}-3(E{y2})2(1)

式中, E{y4}为y4的数学期望值; E{y2}为y2的数学期望值。

对于大多数非高斯随机变量来说, 峭度不等于“ 0” 。由于峭度有正有负, 因此, 非高斯性的测量一般利用峭度的绝对值或是平方, 值为“ 0” 的是高斯变量, 大于“ 0” 的是非高斯变量。本文采用峭度的绝对值作为非高斯性的度量指标, 即

J(y)= i=1n|kurt(yi)|= i=1n|E{ yi4}-3(E{ yi2})2|(2)

1.2 基于峭度的ICA算法

为了使峭度的绝对值极大化, 可以从某个向量w开始, 依据可观测的信号x1, x2, …, xm(假设数据已经中心化和白化), 计算出使y=bTx峭度绝对值增大最快的方向, 然后将向量b更新, 转到该方向上, 并标准化w, 使‖ b2=1。该操作可以利用梯度法及其扩展运算来实现, 即

J(y)b= J(bTx)b=4[E{x(bTx)3}-3b](3)

则得到梯度算法为

Δ bE{x(bTx)3}-3b (4)

令式(4)中峭度的梯度与b相等, 则有

bE{x(bTx)3}-3b(5)

写成矩阵形式为

BE{X(BTX)3}-3B(6)

为了满足B矩阵中每一个分量‖ b2=1, 需要对矩阵B进行去相关和标准化, 实现方法为

B← (BBT)-1/2B(7)

因此, 可以计算得到分离矩阵W=B'whitening_matrix(其中whitening_matrix是可观测信号X的白化矩阵)。

1.3 改进的IKICA算法

在实际应用中, 因为峭度的值是从可观测信号中估计得到的, 因此, 使用峭度进行非高斯性度量时的最主要问题是峭度对由于噪声等引起的图像异常值(outliers)比较敏感, 从而降低了算法的鲁棒性。同时, 在处理相关性较强的数据时, 分离矩阵W的初始值的选择对算法的收敛性影响较大[8], 会出现算法不收敛的情况。因此, 为了改善基于峭度的ICA算法的性能, 本文引入了最小噪声分量变换, 在去除噪声对数据影响的同时去除数据相关性, 从而降低数据维数。

最小噪声分量变换是Green等[8]在主成分分析理论的基础上改进得到的, 通常用于去除数据中的噪声成分, 同时确定高光谱数据的本征维数从而减少后续处理的运算量。

该方法以噪声协方差的估计矩阵为基础, 调整噪声的取值并去除其波段间的相关性。在结果数据中, 噪声的方差为1 , 并且在波段间无相关性。假设高光谱数据X=[x2, x2, …, xm]T可以表示为

X=Z+N(8)

式中, 矩阵ZN分别为理想信号和噪声矩阵, 且彼此不相关。

则第i波段的噪声分量定义为NFi= Var{Ni}Var{Xi}, 信噪比定义为SNRi= Var{Zi}Var{Ni}

CXCZCN分别为可观测信号、理想信号以及噪声的协方差矩阵, 并且CX=CZ+CN

假设FCN的白化矩阵, CN的特征值矩阵为 ΛN(p)=diag(λ N1, λ N2, …, λ Np), 其中p为波段数, 则

FTCNF=I, FTF= ΛN(p), F= UN(p)ΛN(p)(9)

式中, I为单位矩阵; 矩阵 UN(p)CN的特征向量组成, 且满足( UN(p))TCN U(p)N= ΛN(p)

假设Cw=FTCXF为噪声白化之后的观测数据的协方差矩阵, Cw矩阵特征值组成的对角矩阵为 Λw(p)=diag(λ w1, λ w2, …, λ wp), 对矩阵Cw做主成分变换, 可得到由矩阵Cw特征向量组成的 Uw(p), 使

( Uw(p))TCw Uw(p)= Λw(p), ( Uw(p))T Uw(p)=I(10)

于是得到最小噪声分量变换矩阵, 即

M=F Uw(p)(11)

由式(11)得到观测信号最小噪声分量变换后的矩阵为

T=MTX(12)

经式(12)变换之后, 可观测信号各个波段间彼此不相关, 且各个波段按信噪比由大到小排列为SN RT1SN RT2、…、SN RTp, 即按变换后矩阵T的特征值排列, 较大的特征值对应信号为主的图像, 接近于1的特征值代表噪声占主导的图像。在变换之后, 通常可以直接利用T进行数据后续处理。但Cheriyadat等[9]证明, 主成分变换完全依赖于数据整体的协方差, 当类内方差占据类间方差的主体时, 主成分变换倾向于将数据向不利于分类的方向投影。可见, 最小噪声分量变换与主成分变换具有相同的特点。因此, 本文提出的算法在完成最小噪声变换之后, 利用最小噪声分量反变换将数据转换回到光谱空间, 这样可以最大程度地保证数据的可分性。

2 IKICA算法性能验证及应用

本文采用北京小汤山同一航带OMIS高光谱数据进行IKICA算法性能的验证, 且分别与基于负熵的ICA及基于最大似然估计的ICA方法进行了性能比较; 并采用方麓茶场PHI航空高光谱数据进行地物分类应用, 试验结果与地面调查情况基本吻合, 未出现明显的错误分类, 取得了良好的分类结果。

2.1 算法性能验证

试验区位于北京小汤山精准农业示范区, 地理坐标为40° 10'31″~40° 11'18″N, 116° 26'10″~116° 27'05″E。高光谱数据由OMIS成像光谱仪于2001年4月11日获取, 地面分辨率为3 m, 在450~2 500 nm波谱范围内具有112个波段。为了验证IKICA算法的性能, 本文采用同一航带覆盖不同区域的数据合成得到的图像, 背景为均一的农田, 目标为人工目标(共包含20个目标, 每个目标占2个像元), 数据大小为150× 100× 112。对该数据已经进行了基于线性回归方法的辐射校正。采用本文提出的IKICA、基于负熵的ICA和基于最大似然估计的ICA(Maximum Likelihood-based ICA, MLICA)模型分别进行算法收敛性、迭代次数、平均计算时间和检测概率等性能的定量评价与验证。每种算法执行20次, 性能比较如表1所示。

表1 不同算法性能比较 Tab.1 Performance comparison for different algorithm

比较表1中列出的3种算法可以看出, 基于负熵ICA算法的平均计算时间最长, 迭代次数最多, 并且在20次计算中出现了2次不收敛, 但误检测概率最低(在二值化结果中为0); MLICA算法的误检测概率最高, 但平均计算时间和迭代次数比基于负熵ICA算法降低了10倍; 本文提出的IKICA算法的平均计算时间只有38.116 9 s, 平均迭代次数仅为20次, 并且未出现不收敛情况, 误检测概率只有0.047 %。通过比较说明, 本文提出的IKICA算法具有运算效率较高、收敛速度较快、算法稳定性良好以及误检测概率较低等良好性能。

2.2 地物分类应用

利用由上海技术物理研究所研制的PHI成像光谱仪获取的江苏方麓茶场航空高光谱数据进行IKICA算法的地物分类应用研究, 数据大小为210× 150× 64。

选择的测试样本以及7种地物类型的标识如表2所示。

表2 分类结果统计参数 Tab.2 Statistical parameters of classification

分类应用研究的地面信息参考图像如图1(a)所示; 图1(b)给出了应用本文提出的IKICA方法对方麓茶场PHI高光谱数据进行非监督分类的结果。

图1 地物分类结果Fig.1 Classification results

通过与图1(a)所示的地物参考信息比较可以看出, 本文提出的IKICA方法取得了良好的非监督分类结果, 没有出现明显错误分类情况, 具有较高的分类精度; 使用测试样本对分类效果与应用能力进行定量评价, 混淆矩阵与Kappa系数等统计参数计算如表2所示, 总体分类精度为91.68 %, Kappa系数为0.901。

3 结论

(1)目标检测与分类是高光谱遥感数据应用的主要方向之一, 但目前的非监督分类算法大多数是从数据的一阶和二阶统计特性角度考虑的, 而一阶和二阶统计特性往往不能完全表征数据的结构; 并且随着高光谱数据维数的增加, 在许多情况下数据不满足一定的概率分布(如正态分布), 使该类算法的应用受到了很大的限制。因此, 为了更加精确、稳定地进行高光谱遥感数据非监督分类, 本文提出了基于数据高阶统计特性的IKICA算法, 并针对利用峭度估计非高斯性时对噪声等影响的敏感问题提出了改进模型。

(2)为了验证IKICA算法的性能, 本文采用小汤山同一航带的OMIS高光谱数据进行定量评价与验证。结果表明, 与基于最大似然估计的ICA(MLICA)和基于负熵的ICA算法相比, 本文提出的IKICA算法在误检测概率只有0.047%的情况下, 平均计算时间短, 平均迭代次数少, 并且没有出现不收敛的情况, 说明该算法具有良好的稳定性和快速性。

(3)利用方麓茶场PHI航空高光谱数据进行了地物分类应用研究, 与地面参考信息比较表明, 本文提出的算法取得了良好的地物分类结果, 没有出现错误分类问题, 获得了总体分类精度达91.68%、Kappa系数为0.901的良好结果, 证明了IKICA算法在高光谱数据非监督分类应用中的有效性、稳定性和实用性。

致谢: 感谢中科院遥感应用研究所的郑兰芬、张兵研究员和高连如博士提供OMIS和PHI高光谱数据, 以及他们在本次研究工作中给予的热情帮助。

The authors have declared that no competing interests exist.

参考文献
[1] 杨哲海. 高光谱影像分类若干关键技术的研究[D]. 南京: 解放军信息工程大学, 2006. [本文引用:1]
[2] Chintan A, Shah, Manoj K, et al. ICA Mixture Model Based on Unsupervised Classification of Hyperspectral Imagery[C]//IEEE Proceedings of the 31st Applied Imagery Pattern Recognition Workshop 2002(AIPR’02). Washington DC: IEEE, 2002: 29-35. [本文引用:1]
[3] Hyvärinen A, Karhunen J, Oja E. Independent Component Analysis[M]. New York: Wiley, 2001. [本文引用:1]
[4] Stefan A R, Pramod K V. Target Detection in Hyperspectral Images Based on Independent Component Analysis[C]//Proc SPIE Int Soc Opt Eng. USA: Orland o, 2002. [本文引用:1]
[5] Chiang S S, Chang C I, Ginsberg I W. Unsupervised Target Detection in Hyperspectral Images Using Projection Pursuit[J]. IEEE Trans Geoscience and Remote Sensing, 2001, 39(7): 1380-1391. [本文引用:1]
[6] Li Na, Du Peng, Zhao Hui-jie. Independent Component Analysis Based on Quantum Genetic Algorithm and Its Application to Hyperspectral Images[C]//IEEE International Geoscience and Remote Sensing Symposium(IGRSS)2005. Seoul Korea: IEEE, 2005, 6: 4323-4326. [本文引用:2]
[7] 赵慧洁, 李娜. 改进独立成分分析在高光谱图像分类中的应用[J]. 北京航空航天大学学报, 2006, 32(11): 1333-1336. [本文引用:1]
[8] Green A A, Berman M. A Transformation for Ordering Multispectral Data in Terms of Image Quality with Implications for Noise Removal[J]. IEEE Transactions on Geoscience and Remote Sensing, 1988, 26(1): 65-74. [本文引用:2] [JCR: 2.933]
[9] Cheriyadat A, Bruce L M. Why Principal Component Analysis Is Not an Appropriate Feature Extraction Method for Hyperspectral Data[C]//International Geoscience and Remote Sensing Symposium(IGARSS). Toulouse France: IEEE, 2003: 3420-3422. [本文引用:1]