国土资源遥感, 2019, 31(3): 59-64 doi: 10.6046/gtzyyg.2019.03.08

技术方法

空谱特征分层融合的高光谱图像特征提取

姚本佐1, 何芳2

1. 安徽公安职业学院,合肥 230088

2. 火箭军工程大学核工程学院,西安 710025

Spatial and spectral feature hierarchical fusion for hyperspectral image feature extraction

YAO Benzuo1, HE Fang2

1. Anhui Police College, Hefei 230088, China

2. School of Nuclear Engineering,Rocket Force Engineering University, Xi’an 710025, China;

责任编辑: 陈理

收稿日期: 2018-10-8   修回日期: 2019-01-21   网络出版日期: 2019-09-15

基金资助: 质量工程项目安徽省教育厅警务实战技能教学团队资助

Received: 2018-10-8   Revised: 2019-01-21   Online: 2019-09-15

作者简介 About authors

姚本佐(1964-),男,副教授,主要从事警务指挥与战术方向研究。Email:ybZ135@sina.com.。 。

摘要

利用基于光谱维的特征提取方法将原始高光谱图像数据降到一定维数,对降维后的数据采用多尺度自适应加权滤波器(adaptive weighted filters,AWF)进行滤波,将在所有尺度上得到的滤波结果分层融合为新的图像,设计了分层融合框架,有效提取出了高光谱图像中重要的空谱特征,从而提高了分类精度。又将主成分分析(principal component analysis,PCA)算法融入到该框架中,提出了分层融合-主成分分析(hierarchical fusion principal component analysis,HF-PCA)算法。该方法不仅降低了波段间的冗余性,而且削弱了样本的类内差异性,提高了高光谱图像的分类精度。在Indian Pines和Salinas数据库上的实验结果表明,即使在训练样本数量较少的情况下,由HF-PCA算法得到的分类精度明显高于其他算法,2种数据总体分类精度的最大值分别为86.73%和95.01%,有效提高了高光谱图像的分类精度。

关键词: 空谱特征 ; 分层融合 ; 分层融合-主成分分析 ; 高光谱图像分类

Abstract

In this paper, the multi-dimensional adaptive weighted filter (AWF) is used to filter the hyperspectral image with a certain dimension which are reduced by the feature extraction method based on spectral dimension. Then, the filter results obtained on all scales are hierarchical fusion into a new image, and the hierarchical fusion framework is designed. These treatments make the essential spatial and spectral features in hyperspectral images extracted effectively, so the classification accuracy is improved. The principal component analysis (PCA) algorithm is integrated into the framework, and a hierarchical fusion-principal component analysis (HF-PCA) algorithm is proposed. This method not only reduces the redundancy between bands, but also weakens the internal differences of the samples and improves the classification accuracy of hyperspectral images. Experimental results on the Indian Pines and Salinas databases demonstrate that the classification accuracy obtained by the HF-PCA algorithm is significantly higher than that of other algorithms, even when the number of training samples is small, and the maximum value of the overall classification accuracy is 86.73% and 95.01%, respectively. The classification accuracy of hyperspectral images is improved effectively.

Keywords: spatial and spectral feature ; hierarchical fusion ; hierarchical fusion-principal component analysis ; hyperspectral image classification

PDF (3769KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

姚本佐, 何芳. 空谱特征分层融合的高光谱图像特征提取. 国土资源遥感[J], 2019, 31(3): 59-64 doi:10.6046/gtzyyg.2019.03.08

YAO Benzuo, HE Fang. Spatial and spectral feature hierarchical fusion for hyperspectral image feature extraction. REMOTE SENSING FOR LAND & RESOURCES[J], 2019, 31(3): 59-64 doi:10.6046/gtzyyg.2019.03.08

0 引言

高光谱图像是由二维空间维和一维光谱维组成的“空谱合一”的超维数据[1,2,3]。将不同时期高光谱图像上的地形地貌以及目标变化作为一种有效的探测手段,在军事侦察和公安战术指挥等领域发挥了重要的作用[4,5,6,7]。然而,高光谱图像具有的较高数据维数也为高光谱图像处理带来了巨大的挑战,具体表现在,数据的存储与传输需要性能更高的计算平台; 数据处理的复杂性增加,处理效率降低[8]。降维方法可以有效解决上述问题,实现数据的维数约减,从而降低数据处理的复杂性。根据实现方法的不同,降维可以分为特征提取及特征选择2大类。

高光谱图像特征提取方法众多[9,10,11]。常用的方法有: 主成分分析(principal component analysis,PCA)、无监督判别投影(unsupervised discriminant projection,UDP)、局部保持投影(locility preserving projection,LPP)算法和近邻保持嵌入(neighborhood preserving embeding,NPE)算法。然而,这些方法仅利用了高光谱图像的光谱特征,并没有充分利用高光谱图像的空间特征。Li等[12]利用多特征融合方法提出了一种新的高光谱图像分类框架,可以处理高光谱数据线性和非线性的类边界问题。基于此,本文设计了分层融合框架,利用基于光谱维的特征提取方法学习样本的判别特征,通过多尺度自适应加权滤波器(adaptive weighted filters,AWF)迭代更新样本的近邻区域,提取样本的多尺度空间特征,减小样本的类内差异性,使得到的分类结果更加平滑。在此基础上,将无监督降维算法PCA融合到分层融合框架中,进一步提出了分层融合-主成分分析(hierarchical fusion-principal component analysis,HF-PCA)算法。首先,利用PCA算法将原始高光谱图像降维,减小波段间的冗余性; 然后,对降维后的数据采用多尺度AWF滤波,将每一个尺度上得到的滤波结果作为一层新的空谱特征,再将所有特征融合为新的图像; 最后,采用K最近邻(K-nearest neighbor,KNN)分类器进行分类。

1 空谱特征分层融合学习方法

1.1 基于AWF的空间特征学习方法

AWF是一种空间滤波器,可以提取高光谱图像的空间信息。图13×3的AWF示意图。

图1

图1   AWF示意图

Fig.1   Adaptive weighted filters


图1中第 i行第 j列像元点的自适应权重为

wspai,j=sij/i=1,j=1lsij ,
sij=exp(-p0-pij2σ) ,

式中: l为滤波器的尺寸; sij为相似度衡量指标; p0为滤波器中心位置的像素值; pij为该区域中第 i行第 j列的像素值; σ的计算公式为

σ=1std(d) ,
d(i-1)×l+j=p0-pij2

图1可以看出,在AWF中不同位置的权重不同。中心像元点的权重可以通过对其邻近像元的权重进行加权求和得到。

1.2 PCA

PCA是一种经典的特征提取算法,作为一种预处理手段,在高光谱图像处理中也具有重要的应用。设高光谱数据集为 X=[x1,x2,,xN]RN×D,其中, N为每个波段上像元的个数, D为所有波段的个数,则矩阵 X的均值μ

μ=1Ni=1Nxi

此外,矩阵 X的协方差矩阵 S

S=1Ni=1N(xi-μ)(xi-μ)T

采用特征值分解的方法可得到 S的特征值和特征向量为

Swi=λiwi,i=1,2,,N ,

式中 λi为特征向量 wi对应的特征值。将特征值 λi按从大到小的顺序进行排列,从中选取前 k个较大的特征值对应的特征向量组合成高光谱图像的特征空间,即 {w1,w2,...,wk}

降维后的数据 yi是将经过去均值化处理的数据映射到该特征空间中,即

yi=wT(xi-μ)

1.3 基于PCA与AWF分层融合的学习方法

PCA利用最小均方根误差准则和二阶统计方法为样本点寻找一个最佳的投影方向,使投影后得到的数据间的方差最小,能够提取出高光谱图像中的重要光谱特征,降低维数,减小数据量。本文提出PCA与AWF分层融合的HF-PCA算法,首先,采用PCA算法将高光谱图像降维,获取其低维光谱特征; 然后,采用多尺度AWF在光谱特征上进行空间滤波,平滑降维后的图像,增大同类样本间的相似性,有利于高光谱图像的分类。HF-PCA算法具体步骤如下: ①在光谱维上,采用PCA算法将原始高光谱图像降到 n维; ②在空间维上,对获得的光谱特征数据分别采用不同尺度的AWF进行滤波,得到空谱Map1,Map2,…,Mapk; ③将得到的所有空谱Map图融合为 n×k的多层Map图; ④重复步骤②和③ m次,得到经过 m次融合后的空谱图像; ⑤采用KNN分类器对融合后的数据进行分类。HF-PCA算法框架如图2所示,图2中AWF-Sk表示采用第 k个尺度的自适应加权滤波器。

图2

图2   单次HF-PCA算法框架

Fig.2   Frame of HF-PCA


2 实验验证与结果分析

2.1 实验数据

选择具有代表性的Indian Pine[13]和Salinas[14]图像用于验证本文所提算法的有效性。Indian Pines图像是1992年6月由AVIRIS传感器在美国印第安纳州的一块印度松树测试地获取的。该图像大小为145像元×145像元,去除水汽吸收及噪声剩下200个波段用于实验。图像上含有16类不同的地物类型。图3(a)为Indian Pines B50(R),B27(G),B17(B)假彩色合成影像,图3(b)为其地面真实数据,图例中数值为样本个数。

图3

图3   Indian Pines图像

Fig.3   Indian Pines hyperspectral image


Salinas图像是由AVIRIS传感器在加利福尼亚州萨利纳斯山谷获得的,数据空间分辨率为3.7 m,图像大小为512像元×217像元,包含224个波段,去除20个被污染波段后,剩下204个波段用于实验。图像上共含有16类不同的地物类型。图4(a)为选取Salinas B16(R),B130(G),B200(B)假彩色合成影像,图4(b)为其地面真实数据,图例中数值为样本个数。

图4

图4   Salinas图像

Fig.4   Salinas hyperspectral image


2.2 实验方法

首先,采用PCA和HF-PCA算法对高光谱图像进行降维; 然后,采用KNN分类器对降维后的数据进行分类。将不做降维处理直接进行分类的结果作为基准线(baseline)。利用高光谱图像的分类精度评价指标: 总体精度(overall accuracy,OA)、平均精度(average accuracy,AA)和Kappa系数衡量各个算法的分类性能[13]。OA,AA和Kappa系数越高表明该方法对高光谱图像的分类效果越好。

2.3 基于Indian Pines数据库的高光谱图像分类

从Indian Pines数据库中随机选取每类样本的5%作为训练样本,样本数不足100时选取10个,剩下的所有样本作为测试样本。将每种算法重复进行5次分类实验,取5次OA和Kappa系数的均值作为最终的分类结果。设置HF-PCA算法初始降到的维数为15,融合次数 m为3,多尺度AWF滤波器的尺度为5,每个尺度上的窗口分别为 3×3,5×5,7×7,9×9,11×11。设定所有降维算法降到的维数为15,训练样本选取每类地物样本的5%(样本数不足100时选10个)时,由不同算法获得的地物分类结果如图5所示,各类地物的分类精度如表1所示。

图5

图5   Indian Pines数据库各算法的分类结果

Fig.5   Classification results of different algorithms in Indian Pines dataset


表1   Indian Pines数据库不同算法各类地物的分类精度

Tab.1  Classification accuracy of different types of features in Indian Pines dataset by different algorithms(%)

地物类别KNNPCAHF-PCA地物类别KNNPCAHF-PCA
Alfalfa80.5680.5697.78Oats80.0070.00100
Corn-notill46.5745.8484.32Soybeans-notill61.2160.4687.06
Corn-mintill57.4956.6079.06Soybeans-mintill66.2164.7190.21
Corn28.0029.3347.20Soybeans-clean44.4043.1670.05
Grass/pasture78.8778.2187.93Wheat94.3693.3398.15
Grass/trees94.3794.5297.63Woods88.0288.6995.97
Grass/pasture-mowed10010097.78Buildings-grass-tree-drives41.1439.7862.94
Hay-windrowed94.7194.0598.37Stone-steel-towers85.5485.5492.53

新窗口打开| 下载CSV


图5可知,由HF-PCA算法得到的地物分类结果更加平滑,错分或漏分现象明显减小。进一步由表1的定量分析可知,HF-PCA算法对大多数地物的分类精度均有显著提高,除Grass/pasture-mowed地物外,其他15类地物的分类结果均显著高于其他算法。造成这种现象的原因可能是因为在分层融合的时候只是单纯地将光谱特征进行叠加,没有考虑高光谱图像样本的分布特点,高光谱数据在空间上具有分布一致性特点,即相邻样本点属于同一类的概率较大。HF-PCA算法从全局考虑提升样本的OA和Kappa系数,忽视了高光谱样本的局部特性,因此,在后续工作中,可以考虑结合高光谱图像的局部分布特点和全局特性提出更加有效的高光谱图像处理算法。就整体而言,HF-PCA算法得到的OA为86.73%,分别比KNN和PCA的结果高出了20.04%和20.74%; 得到的Kappa系数为0.848 4,分别比KNN和PCA的结果提高了0.229 5和0.237 4。这是由于HF-PCA算法引入分层融合的方法获取高光谱图像的不同空间结构,将其与降维后的光谱特征进行融合学习,分层融合的空谱特征既降低了信息的冗余度,又增加了同类样本的相似性,增强了样本的可分性,有利于高光谱图像的分类,对于小样本的分类仍然具有优越性。

2.4 基于Salinas数据库的高光谱图像分类

在Salinas数据库上进行同样的实验,选取每类地物样本的1%作为训练样本,其余所有样本作为测试样本。将各种降维算法降到10维,融合次数 m设为3,设置HF-PCA算法中的多尺度AWF滤波器的尺度为5,每个尺度上的窗口分别为 3×3,5×5,7×7,9×9,11×11。在训练样本相同的情况下,由不同算法获得的地物分类结果如图6所示,各类地物的分类精度如表2所示。

图6

图6   Salinas数据库各算法分类结果

Fig.6   Classification results of different algorithms in Salinas dataset


表2   Salinas数据库不同算法各类地物的分类精度

Tab.2  Classification accuracy of different types of features in Salinas dataset by different algorithms(%)

地物类别KNNPCAHF-PCA地物类别KNNPCAHF-PCA
Brocoli-green-weeds_198.5498.5499.75Soil-vinyard-develop97.4997.3999.56
Brocoli-green-weeds_298.5498.4399.70Corn-senesced-green-weeds83.9483.2092.49
Fallow80.8879.0996.62Lettuce-romained-4wk88.9388.9389.76
Fallow-rough-plow98.7098.7099.07Lettuce-romained-5wk10010099.97
Fallow-smooth95.3696.2797.83Lettuce-romained-6wk97.5796.9199.05
Stubble98.8598.8599.78Lettuce-romained-7wk87.5487.4496.83
Celery98.9398.9399.60Vinyard_untrained59.6559.3288.25
Grapes-untrained70.3969.3089.57Vinyard_vertical-trellis89.6689.6096.18

新窗口打开| 下载CSV


图6可知,由HF-PCA算法得到的地物分类结果更加平滑,地物的分布更加清晰,这是由于HF-PCA算法利用了高光谱图像的空间结构信息,比单纯地利用高光谱的光谱信息实现降维分类具有明显的优势。进一步由表2的分析可知,HF-PCA算法对大多数地物的分类精度均有显著提高。由HF-PCA算法得到的OA为95.01%,分别比KNN和PCA的结果高出了9.98%和10.34%; 得到的Kappa系数为0.944 5,分别比KNN和PCA的结果高出了0.111 2和0.115 2,再次证明了分层融合空谱特征提取方法的有效性。

3 结论及展望

针对高光谱图像中维数较高,数据间的冗余性较大的问题,本文提出了分层融合-主成分分析(HF-PCA)算法,该算法有效提高了高光谱图像的分类精度。主要结论为:

1)设计了分层融合框架,有效提取了高光谱图像中重要的空谱特征,从而提高分类精度。

2)将PCA算法融入到分层融合框架中,提出了HF-PCA算法,不仅降低了波段间的冗余性,而且削弱了样本的类内差异性,显著提高了高光谱图像的分类精度。

3)实验结果表明,即使在训练样本数量较少的情况下,由HF-PCA算法得到的分类精度明显高于其他算法。

然而,本文所提算法从全局角度提升样本的总体分类精度和Kappa系数,但忽视了高光谱样本的局部特性。因此,在后续工作中,将考虑结合高光谱图像的局部分布特点和全局特性,提出更加有效的高光谱图像处理算法。

参考文献

高晓惠 .

高光谱数据处理技术研究

[D]. 西安:中国科学院大学, 2013.

[本文引用: 1]

Gao X H .

Research on Technologies of Hyperspectral Data Processing

[D]. Xi’an:University of Chinese Academy of Science, 2013.

[本文引用: 1]

Plaza A, Benediktsson J A, Boardman J W , et al.

Recent advances in techniques for hyperspectral image processing

[J]. Remote Sensing of Environment, 2009,113(s1):S110-S122.

[本文引用: 1]

Bioucas-Dias J M, Plaza A, Camps-Valls G , et al.

Hyperspectral remote sensing data analysis and future challenges

[J]. IEEE Geoscience and Remote Sensing Magazine, 2013,1(2):6-36.

[本文引用: 1]

王晓飞, 侯传龙, 阎秋静 , .

基于相关向量机的高光谱图像噪声评估算法

[J]. 红外与激光工程, 2014,43(12):4159-4163.

Magsci     [本文引用: 1]

为了更准确的估计高光谱图像噪声强度,提出了一种基于相关向量机(RVM)的高光谱图像噪声评估算法。对该算法所采用的RVM 回归原理、残差与噪声的关系等进行了研究。首先,介绍了高光谱图像噪声评估中应用较为广泛的空间/光谱维去相关法的特点及不足。接着,对可有效进行非线性回归分析的RVM 进行了介绍。然后,针对传统的空间/光谱维去相关法在系统中存在较强的非线性关系时,得到的残差将会过大这一问题,提出利用RVM 回归分析去除具有高相关性的信号,利用得到的残差图像对噪声进行估算,从而提高评估系统的稳定性。实验结果表明:噪声强度估计精度优于8%;相比传统算法更有效。总体看,该算法可以满足自动高光谱图像噪声评估的稳定可靠、精度高等要求。

Wang X F, Hou C L, Yan Q J , et al.

Noise estimation algorithm based on relevance vector machine for hyperspectral imagery

[J]. Infrared and Laser Engineering, 2014,43(12):4159-4163.

Magsci     [本文引用: 1]

张成业, 秦其明, 陈理 , .

高光谱遥感岩矿识别的研究进展

[J]. 光学精密工程, 2015,23(8):2407-2418.

[本文引用: 1]

Zhang C Y, Qin Q M, Chen L , et al.

Research and development of mineral identification utilizing hyperspectral remote sensing

[J]. Optics and Precision Engineering, 2015,23(8):2407-2418.

[本文引用: 1]

邓承志, 张绍泉, 汪胜前 , .

L1稀疏正则化的高光谱混合像元分解算法比较

[J]. 红外与激光工程, 2015,44(3):1092-1097.

URL     [本文引用: 1]

基于稀疏性的高光谱解混是近年来高光谱混合像元分解的研究热点。主要研究了L<sub>1</sub>正则化的高光谱混合像元分解算法。首先分析了L<sub>1</sub>正则化的三种解混模型,即无约束、非负约束和全约束模型;然后给出了三种模型对应的数值求解算法;最后,采用模拟的和真实的高光谱数据进行实验,比较了三种高光谱混合像元分解算法的效果。实验结果表明:三种模型均具有很好的高光谱混合像元分解精度(SRE),其中全约束模型最好,非负约束模型次之,无约束模型最差;全约束模型在信噪比低和端元数多的情况下,仍然获得较高的SRE。

Deng C Z, Zhang S Q, Wang S Q , et al.

Hyperspectral unmixing algorithm based on L1 regularization

[J]. Infrared and Laser Engineering, 2015,44(3):1092-1097.

[本文引用: 1]

唐中奇, 付光远, 陈进 , .

基于多尺度分割的高光谱图像稀疏表示与分类

[J]. 光学精密工程, 2015,23(9):2708-2714.

[本文引用: 1]

Tang Z Q, Fu G Y, Chen J , et al.

Multiscale segmentation-based sparse coding for hyperspectral image classification

[J]. Optics and Precision Engineering, 2015,23(9):2708-2714.

[本文引用: 1]

王琳, 李迅, 包云轩 , .

遥感技术在交通气象灾害监测中的应用进展

[J]. 国土资源遥感, 2018,30(4):1-7.doi: 10.6046/gtzyyg.2018.04.01.

[本文引用: 1]

Wang L, Li X, Bao Y X , et al.

Research progress of remote sensing application meteorological disasters

[J]. Remote Sensing for Land and Resources, 2018,30(4):1-7.doi: 10.6046/gtzyyg.2018.04.01.

[本文引用: 1]

叶珍 .

高光谱图像特征提取与分类算法研究

[D]. 西安:西北工业大学, 2015.

[本文引用: 1]

Ye Z .

Research on Feature Extraction and Classification Algorithm for Hyperspectral Image

[D]. Xi’an:Northwestern Polytechnical University, 2015.

[本文引用: 1]

黄鸿, 杨媚, 张满菊 .

基于稀疏鉴别嵌入的高光谱遥感影像分类

[J]. 光学精密工程, 2013,21(11):2922-2930.

DOI:10.3788/OPE.20132111.2922      Magsci     [本文引用: 1]

稀疏保持投影(SPP)是一种基于l1图的新型降维算法,它利用样本间的稀疏重构关系建图,但是SPP为非监督算法,分类效果受到限制。针对此问题,本文提出了一种新的稀疏流形学习算法-稀疏鉴别嵌入(SDE)。该算法在利用样本的稀疏重构关系建图时引入了样本的类别信息,并通过优化目标函数来得到投影矩阵,使得不同类的数据点在低维嵌入空间中尽可能地分散开。SDE通过结合数据稀疏性及类间流形结构的优点,不仅保留样本间的稀疏重构关系,而且通过引入训练样本的类别信息实现稀疏鉴别特征提取,更有利于分类。在Urban和Washington DC Mall数据集上的实验结果表明:SDE算法比其他算法的分类性能有明显的提升,在每类随机选取16个训练样本的情况下,SDE算法的分类精度分别达到了73.47%和98.35%。

Huang H, Yang M, Zhang M J .

Hyperspectral remote sensing image classification based on SDE

[J]. Optics and Precision Engineering, 2013,21(11):2922-2930.

Magsci     [本文引用: 1]

黄鸿, 郑新磊 .

加权空-谱与最近邻分类器相结合的高光谱图像分类

[J]. 光学精密工程, 2016,24(4):873-881.

[本文引用: 1]

Huang H, Zheng X L .

Hyperspectral image classification with combination of weighted spatial-spectral and KNN

[J]. Optics and Precision Engineering, 2016,24(4):873-881.

[本文引用: 1]

Li H, Wei Y, Li L , et al.

Hierarchical feature extraction with local neural response for image recognition

[J]. IEEE Transactions on Systems Man and Cybernetics Part B:Cybernetics, 2012,43(2):412-424.

[本文引用: 1]

Pu H Y, Chen Z H, Wang B .

A novel spatial-spectral similarity measure for dimensionality reduction and classification of hyperspectral imagery

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2014,52(11):7008-7022.

[本文引用: 2]

金鹏磊 .

空谱联合高光谱数据降维与分类方法研究

[D]. 西安:西安电子科技大学, 2014.

[本文引用: 1]

Jin P L .

Researches on Spatial-Spectral Based Dimensionality Reduction and Classification of Hyperspectral Data

[D]. Xi’an:Xidian University, 2014.

[本文引用: 1]

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发