基于弱监督鲁棒性自编码的高光谱异常检测
Hyperspectral anomaly detection based on the weakly supervised robust autoencoder
通讯作者: 刘胜震(1987-),男,工程师,主要从事测绘方面的研究。Email:szliu1987@126.com。
责任编辑: 李瑜
收稿日期: 2022-03-21 修回日期: 2022-08-16
Received: 2022-03-21 Revised: 2022-08-16
作者简介 About authors
张国建(1989-),男,讲师,主要从事摄影测量与遥感技术方面的研究。Email:
高光谱异常检测因其以无监督方式检测目标的能力而受到特别关注,自动编码器及其变体可以自动提取深层特征,还可以检测异常目标。由于训练集中存在异常,自动编码器泛化性较强,从而降低了从背景中区分异常的能力。为解决上述问题,该文提出一种基于弱监督鲁棒性自编码的异常探测算法。首先提出了一种显著类别搜索策略,采用基于概率的类别阈值来标记粗样本,为网络弱监督学习做准备; 同时,构建一个具有l2,1范数与异常-背景光谱距离共同约束的鲁棒性自编码网络框架,该框架在训练期间对噪声和异常具有鲁棒性; 最后,采用所有样本得到的重构误差检测异常目标。在4个高光谱数据集上进行实验,结果表明,与其他先进的异常检测算法相比,所提算法具有更好的检测性能。
关键词:
Hyperspectral anomaly detection has received particular attention due to its unsupervised detection of targets. Moreover, autoencoder (AE), together with its variants, can automatically extract deep features and detect anomalous targets. However, AE is highly generalizable due to the existence of anomalies in the training set, thus suffering a reduced ability to distinguish anomalies from the background. This study proposed an anomaly detection algorithm based on the weakly supervised robust AE (WSRAE). First, this study developed a salient category search strategy and used probability-based category thresholds to label coarse samples in order to make preparation for network-based weakly supervised learning. Moreover, this study constructed a robust AE framework constrained jointly by l2,1 norm and anomaly-background spectral distances. This framework was robust with regard to noise and anomalies during training. Finally, this study detected anomalous targets based on the reconstruction errors obtained from all samples. Experiments on four hyperspectral datasets show that the WSRAE algorithm has greater detection performance than other state-of-the-art anomaly detection algorithms.
Keywords:
本文引用格式
张国建, 刘胜震, 孙英君, 俞凯杰, 刘丽娜.
ZHANG Guojian, LIU Shengzhen, SUN Yingjun, YU Kaijie, LIU Lina.
0 引言
成像光谱仪的出现与发展促进了遥感技术的进步,使得高光谱遥感技术在遥感领域受到越来越多的关注。高光谱影像能够同时获取地球表面空间信息和丰富的光谱信息,这些地物光谱信息在目标探测与地物分类中具有显著优势[1]。目标探测技术是高光谱遥感领域的一个重要应用,而异常探测技术由于不需要任何目标与背景的先验信息,因此实际应用价值更高,广泛应用于精准农业、环境监测、军事领域等[2]。异常目标定义为目标光谱特征与周围地物的光谱特征具有明显差异,且其目标小、数量少、分布随机的特性,因此异常目标的类型往往难以获取[3]。高光谱异常检测通常具有以下特点[4]: ①异常目标具有低概率特性; ②异常在光谱特征上与背景明显不同; ③没有关于背景或异常的光谱先验信息可用; ④在复杂背景情况下,异常目标与背景混合,往往为混合像元或亚像元。这些特性使得高光谱异常检测成为遥感领域中一个研究热点。
近年来,研究者提出大量异常探测算法。由Reed等提出的RX算法[5]通过假设背景服从某种分布,再使用统计方法来估计像素属于异常目标的概率。随后部分研究学者提出一些基于RX算法的改进算法,例如非线性的核RX异常探测算法[6]、基于权重RX探测算法[7]等。然而,真实高光谱影像含有多类背景地物且分布不均匀,因此很难准确对不同背景地物建模,在实际应用中往往受限[8]。为了避免估计背景分布,Li等[9]提出基于协同表示的异常探测算法(collaborative representation-based detector,CRD),该算法假设每个像素可以由背景字典进行线性组合,其中预测值与真值之间的残差被视为像素的异常程度。针对背景字典中存在异常点污染导致检测精度下降的问题,刘万军等[10]利用背景字典与字典均值的距离对背景字典中的各像元自适应设计权重,通过降低异常像元的权重提升检测精度。基于低秩和稀疏矩阵分解的马氏距离异常检测算法(low-rank and sparse matrix decomposition-based Mahalanobis distance anomaly detection, LSMAD)通过在去除稀疏异常后充分探索背景的低秩特性来建立背景模型[11]。基于分数傅里叶熵的检测器 (FrFE)创新性地将分数傅里叶熵理论引入高光谱异常检测中,取得了良好的检测结果[12]。尽管上述方法取得了良好的探测效果,但仅利用了低阶特征,这也限制了检测器的性能。
近年来,深度学习已经应用在高光谱遥感影像分类及目标探测当中,其中自编码网络(autoencoder,AE)是非监督学习领域中的一种,其以自动的方式获取抽象的、层次化的特征,已应用到高光谱异常检测中[13⇓-15]。Xie等[16]提出了一种光谱约束对抗AE(SC_AAE),其中将光谱约束策略结合到对抗性AE中以学习高光谱数据的潜在表示,然后使用双层架构实现异常检测; Lu等[17]提出了基于流形约束 AE 网络,该方法添加嵌入流形学习约束,最后,由全局和局部组成的重构误差用于异常检测。为了提出异常检测性能,Zhao等[18]将高光谱影像分解为低秩部分和稀疏部分,低维潜在特征分别由2个堆叠AE学习,最后采用局部马氏距离检测异常目标。上述深度方法有效提升了检测性能,AE网络在经过适当训练的情况下表现良好,而且由于没有背景或异常的先验光谱特征,训练集容易被异常像元破坏。当训练集中存在异常时,AE学习性能非常好,以至于它可以很好地学习异常并以较小的重建误差重建异常,使得检测性能降低。
为解决上述问题,本文提出一种基于弱监督鲁棒性自编码的异常探测算法(weakly supervised robust AE,WSRAE)。该算法首先提出了一种显著类别搜索方法来搜索样本的伪标签,即弱监督学习所需的不准确标签。同时,引入
1 方法原理
针对训练样本中含有异常目标且AE网络训练不稳定问题,本文提出了一种用于高光谱异常检测的弱监督方法,并通过以弱监督方式对所提出的RAE网络进行对抗训练,从而学习具有背景鲁棒性和异常突出性的端到端重建。图1表示本文提出的WSRAE算法的框架,该方法由3个主要部分组成: 显著类别搜索、弱监督RAE学习和重构影像的异常检测。
图1
1.1 显著类别搜索
针对训练样本中含有异常目标导致异常检测精度降低,结合基于密度的噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法[19],本文设计一种非监督的背景与异常目标的显著类别搜索算法,其是为弱监督网络学习准备,旨在预测给定输入的伪标签。根据预测的伪标签,该过程搜索包含2个子集,包括一个粗略的异常样本集,其中像素具有较高的属于异常的概率,以及一个粗略的背景样本集,其中像素具有较高的属于背景的概率。因此,显著类别搜索问题可以看作是一个初始异常-背景分离问题,该算法分为3个主要部分: 显著类别提取、坐标索引和粗样本集构建。
在没有任何背景与目标先验知识的情况下,本文首先应用DBSCAN的非监督聚类方法获取类别概率图(即聚类结果图)。由于DBSCAN算法能够发现具有不同大小和形状的簇,并且在噪声和异常值的情况下对指定簇数的聚类性能更具有鲁棒性,因此DBSCAN在高光谱异常检测中具有显著优势。在聚类过程中,利用DBSCAN扫描每个像元在Eps(即相邻点之间的最小距离)距离内的邻域,若中心像素的邻居数超过MinPts(最小点数),就形成一个簇,其中距离判定方法采用欧氏距离。
给定一个输入高光谱影像
式中:
式中: 粗异常样本集
1.2 RAE网络
AE网络是一种非监督学习的网络模型,其由编码器与解码器2部分组成,前者用来将输入数据转换为潜在特征,后者是将潜在特征生成为与原始输入数据相似的重构数据[20]。在AE中,编码器的目标是将输入层
式中
AE以神经网络作为函数逼近器,那么数据
由于AE网络在每个待测像素中都采用
式中;
此外,为了更好地区别异常和背景之间的特征,本文构建异常-背景光谱距离(anomaly - background spectral distance, ABSD)约束,其通过以最大化粗异常样本与粗背景样本之间的距离。ABSD的值越大,2个光谱向量的区分度越高。因此,集合
式中:
式中a
通过将公式 (7) 和 (8) 的2个目标函数与正的权衡参数λ集成在一起, RAE网络的目标函数如下:
式中: 第一部分表示重构误差的
1.3 WSRAE算法
利用粗背景样本集对RAE网络训练完成后,利用得到训练完成的模型参数
通过上述重建过程,模型
因此, WSRAE算法以弱监督的方式进行背景习,其不仅可以生成分布均匀的背景,同时结合构建的
本文所提的WSRAE算法的探测过程如下:
输入: 高光谱影像
输出: 高光谱异常检测图。
1)显著类别搜索。
①利用DBSCAN算法,根据式(1),进行显著类别提取;
②利用
③根据式(2)—(3),构建粗背景样本集
2)RAE模型训练。
①初始化,RAE网络模型参数;
②输入粗样本集
③迭代训练,根据式(10)更新网络参数;
3)异常检测。
根据式(11)—(12),计算重构误差。
2 实验结果与分析
2.1 实验数据
在本文中,使用4个高光谱影像数据集来验证所提出算法的有效性,伪彩色图像和异常目标地物真值图,如图2所示。如图2(a)—(b)所示,Urban数据集采用HYDICE传感器获取,空间分辨率为1 m,影像尺寸为80像素×100像素,具有162个光谱波段。如图2(c)—(d)所示,Gulfport数据集据采用AVIRIS 传感器获取,空间分辨率为3.4 m,影像尺寸为100像素×100像素。在400~2 500 nm的波长范围内去除水汽波段与噪声波段后,具有191个波段。该数据集共有60个异常像素,异常地物为飞机。如图2(e)—(f)所示,San Diego-1数据集采用AVIRIS传感器获取,空间分辨率为7.1 m,影像尺寸为100像素×100像素,具有189个光谱波段。3架飞机被视为异常。如图2(g)—(h)所示,San Diego-2数据集采用AVIRIS传感器获取,空间分辨率20 m,影像尺寸为100像素×100像素。
图2
图2
4个高光谱数据集的伪彩色图像和对应的地物真值图
Fig.2
Pseudo color images and the corresponding ground truth maps of the 4 HSI datasets
去除与吸水区域相对应的不良波段后,包含189个波段。由 134个像素组成的3架飞机被视为异常。
2.2 模型结构对比与分析
为验证本文提出的WSRAE算法的先进性,进行以下消融研究: ①采用
表1 4组数据集中消融研究的AUC值
Tab.1
消融方案 | Urban | Gulfport | San Diego-1 | San Diego-2 | ||||
---|---|---|---|---|---|---|---|---|
(Pd,Pf) | (Pf,τ) | (Pd,Pf) | (Pf,τ) | (Pd,Pf) | (Pf,τ) | (Pd,Pf) | (Pf,τ) | |
AE(l2) | 0.977 0 | 0.034 2 | 0.969 0 | 0.020 3 | 0.959 8 | 0.027 3 | 0.946 7 | 0.038 2 |
WSAE(l2) | 0.980 5 | 0.025 5 | 0.974 5 | 0.032 5 | 0.980 5 | 0.019 6 | 0.979 0 | 0.013 4 |
AE(l2,1) | 0.977 5 | 0.024 8 | 0.984 2 | 0.018 5 | 0.979 7 | 0.014 5 | 0.989 5 | 0.025 1 |
WSAE(l2,1) | 0.985 4 | 0.019 2 | 0.982 8 | 0.013 5 | 0.982 5 | 0.025 2 | 0.974 0 | 0.015 7 |
AE(ABSD) | 0.984 1 | 0.020 1 | 0.982 1 | 0.017 4 | 0.979 8 | 0.014 9 | 0.986 4 | 0.018 5 |
WSAE(ABSD) | 0.986 6 | 0.016 6 | 0.987 0 | 0.016 5 | 0.980 4 | 0.012 2 | 0.986 3 | 0.013 9 |
RAE | 0.988 2 | 0.165 4 | 0.988 5 | 0.012 4 | 0.981 6 | 0.012 1 | 0.989 4 | 0.012 2 |
WSRAE | 0.997 7 | 0.018 5 | 0.989 1 | 0.010 5 | 0.984 6 | 0.010 1 | 0.991 4 | 0.010 4 |
2.3 探测结果与分析
为充分验证本文算法的先进性,本文选取了6种先进的异常检测算法进行对比,这6种算法分别为GRX,CRD,LSMAD,FrFE,SC_AAE和MemAE[21]算法。其中GRX,CRD,LSMAD及FrFE为经典传统算法,而SC_AAE和MemAE是先进的深度学习算法。上述深度学习算法在TensorFlow(v1.10.0,Python 3.6.0和CUDA 10.0)中实现,通过使用Adam优化网络,初始学习率为0.000 1,隐藏节点数为64,批量大小为1 024,epoch为3 000。在本文的WSRAE网络中,考虑到网络的像素级处理特性及其对参数的不敏感性,将MinPts固定为1,Eps设为0.2,阈值
表2展示了4组数据集中不同异常检测算法的检测结果对比,本文所提出的 WSRAE算法获得的检测图最接近异常地物真值图。WSRAE方法可以确保在抑制丰富类别的背景的同时突出显示具有不同大小和形状的异常,而其他对比算法更有可能忽略异常、被背景分散注意力或失去异常的形状。以Urban数据集为例,WSRAE确保在最小化背景干扰的同时检测到小目标。在Gulfport数据集中,WSRAE可以捕捉不同尺寸的飞机的形状以及它们的位置, 但是GRX,CRD和MemAE并不能有效捕捉。LSMAD算法几乎失去了2个较小的飞机目标。虽然SC_AAE也可以清楚地检测到异常,但并不能很好地抑制背景。在San Diego数据集中,具有更多结构信息的异常场景中,WSRAE算法仍然可以很好地检测异常,甚至是目标的边缘。SC_AAE算法可以发现异常,但它更容易受到背景干扰。如上所述,尽管GRX 在每个数据集中几乎不受背景的影响,但其异常目标很少被突出显示并且丢失了大部分形状信息。CRD算法易受窗口大小的影响,无法在所有数据集上获得完整的异常目标。LSMAD 算法并不能完整的检测到异常目标。FrFE 和SC_AAE算法在克服噪声和背景方面的鲁棒性较差。MemAE算法尽管能够探测出异常目标,但其抑制背景性能较差。而本文所提出的WSRAE算法在检测异常目标的同时,能够很好地抑制背景。
表2 4类数据集不同异常检测算法结果对比
Tab.2
![]() |
本文采用的4组数据集中各异常检测算法的ROC曲线对比如图3所示。从中可以看出,WSRAE算法的ROC曲线总体上位于左上角,显著优于其他对比算法,并且在同等虚警率条件下WSRAE算法能够达到更高探测率。尽管WSRAE算法与其余算法存在交叉,但在总体上仍位于左上角,仍然可以证明本文方法的先进性。而其余算法在不同数据集中展现的ROC曲线均不稳定,难以适应于所有高光谱数据集。
图3
图3
4组数据集中各异常检测算法的ROC曲线对比
Fig.3
Comparison of ROC curves for different anomaly algorithms in 4 data sets
表3对比了各异常检测算法的AUC的(
表3 4组数据集中各异常检测算法的AUC值
Tab.3
检测算法 | Urban | Gulfport | San Diego-1 | San Diego-2 | ||||
---|---|---|---|---|---|---|---|---|
( | ( | ( | ( | ( | ( | ( | ( | |
GRX | 0.984 8 | 0.0344 | 0.952 6 | 0.024 8 | 0.911 1 | 0.040 6 | 0.940 3 | 0.058 9 |
CRD | 0.982 9 | 0.0454 | 0.821 9 | 0.054 2 | 0.971 5 | 0.051 5 | 0.919 0 | 0.063 7 |
LSMAD | 0.989 7 | 0.0190 | 0.939 5 | 0.024 6 | 0.975 6 | 0.020 1 | 0.965 3 | 0.029 1 |
FrFE | 0.968 7 | 0.0162 | 0.894 1 | 0.049 2 | 0.953 3 | 0.002 4 | 0.962 2 | 0.021 4 |
SC_AAE | 0.934 8 | 0.0307 | 0.893 0 | 0.024 5 | 0.861 7 | 0.019 6 | 0.890 5 | 0.028 3 |
MemAE | 0.997 4 | 0.0337 | 0.961 6 | 0.037 9 | 0.969 7 | 0.047 0 | 0.971 3 | 0.048 7 |
WSRAE | 0.997 7 | 0.0185 | 0.986 2 | 0.015 2 | 0.9846 | 0.005 4 | 0.976 3 | 0.018 5 |
表4记录了4组高光谱数据集采用个异常检测算法的计算时间。GRX算法的平均计算时间更快,但其在检测精度中较差。由于局部窗口参数的影响,CRD方法的运行时间比其他方法要长得多。基于深度学习的方法 SC_AAE,MemAE,WSRAE比传统方法CRD,LSMAD与FrFE算法的运算效率更高。WSRAE算法的时间效率在3种深度学习算法中表现最优,这是因为网络上经过训练后直接利用重构误差进行计算异常,而MemAE和WSRAE包含了相关的后处理步骤,导致运算时间增加。以上分析再次印证了WSRAE强大的竞争力。
表4 异常检测算法的平均计算时间
Tab.4
算法 | Urban | Gulfport | San Diego-1 | San Diego-2 |
---|---|---|---|---|
GRX | 0.468 | 0.445 | 0.911 | 0.326 |
CRD | 98.217 | 45.826 | 74.654 | 94.225 |
LSMAD | 26.784 | 21.941 | 19.261 | 25.635 |
FrFE | 20.751 | 17.462 | 22.026 | 17.844 |
SC_AAE | 3.123 | 5.794 | 4.145 | 7.912 |
MemAE | 5.490 | 5.457 | 5.404 | 5.473 |
WSRAE | 2.364 | 2.455 | 2.248 | 2.461 |
3 结论
本文提出基于弱监督鲁棒性自编码的异常探测算法(WSRAE)。该算法首先提出了一种显著类别搜索方法来搜索样本的伪标签,即弱监督学习所需的不准确标签。为了减轻传统AE对噪声和异常值的敏感性,本文引入
参考文献
中国高光谱遥感的前沿进展
[J].
Current progress of hyperspectral remote sensing in China
[J].
高光谱图像处理与信息提取前沿
[J].
Advancement of hyperspectral image processing and information extraction
[J].
高光谱图像异常目标检测算法研究与进展
[J].
Study and progress of anomaly target detection in hyperspectral imagery
[J].
基于波段选择与学习字典的高光谱图像异常探测
[J].
Hyperspectral imagery anomaly detection based on band selection and learning dictionary
[J].
Adaptive multiple-band CFAR detection of an optical pattern with unknown spectral distribution
[J].DOI:10.1109/29.60107 URL [本文引用: 1]
Kernel RX-algorithm:A nonlinear anomaly detector for hyperspectral imagery
[J].DOI:10.1109/TGRS.2004.841487 URL [本文引用: 1]
Weighted-RXD and linear filter-based RXD:Improving background statistics estimation for anomaly detection in hyperspectral imagery
[J].DOI:10.1109/JSTARS.4609443 URL [本文引用: 1]
Random-selection-based anomaly detector for hyperspectral imagery
[J].DOI:10.1109/TGRS.2010.2081677 URL [本文引用: 1]
Collaborative representation for hyperspectral anomaly detection
[J].DOI:10.1109/TGRS.2014.2343955 URL [本文引用: 1]
改进协同表示的高光谱图像异常检测算法
[J].
Improved collaborative representation for hyperspectral imagery anomaly detection algorithm
[J].
A low-rank and sparse matrix decomposition-based Mahalanobis distance method for hyperspectral anomaly detection
[J].DOI:10.1109/TGRS.2015.2479299 URL [本文引用: 1]
Hyperspectral anomaly detection by fractional Fourier entropy
[J].
DOI:10.1109/JSTARS.2019.2940278
[本文引用: 1]
Anomaly detection is an important task in hyperspectral remote sensing. Most widely used detectors, such as Reed-Xiaoli (RX), have been developed only using original spectral signatures, which may lack the capability of signal enhancement and noise suppression. In this article, an effective alternative approach, fractional Fourier entropy (FrFE)-based hyperspectral anomaly detection method, is proposed. First, fractional Fourier transform (FrFT) is employed as preprocessing, which obtains features in an intermediate domain between the original reflectance spectrum and its Fourier transform with complementary strengths by space-frequency representations. It is desirable for noise removal so as to enhance the discrimination between anomalies and background. Furthermore, an FrFE-based step is developed to automatically determine an optimal fractional transform order. With a more flexible constraint, i.e., Shannon entropy uncertainty principle on FrFT, the proposed method can significantly distinguish signal from background and noise. Finally, the proposed FrFE-based anomaly detection method is implemented in the optimal fractional domain. Experimental results obtained on real hyperspectral datasets demonstrate that the proposed method is quite competitive.
Autoencoder and adversarial-learning-based semisupervised background estimation for hyperspectral anomaly detection
[J].DOI:10.1109/TGRS.36 URL [本文引用: 1]
基于孪生注意力网络的高分辨率遥感影像变化检测
[J].
Change detection of high-resolution remote sensing images based on Siamese network
[J].
基于残差网络特征融合的高光谱图像分类
[J].
Classification of hyperspectral images based on feature fusion of residual network
[J].
Spectral constraint adversarial autoencoders approach to feature representation in hyperspectral anomaly detection
[J].
DOI:S0893-6080(19)30229-1
PMID:31472289
[本文引用: 1]
Anomaly detection in hyperspectral images (HSIs) faces various levels of difficulty due to the high dimensionality, redundant information and deteriorated bands. To address these problems, we propose a novel unsupervised feature representation approach by incorporating a spectral constraint strategy into adversarial autoencoders (AAE) without any prior knowledge in this paper. Our approach, called SC_AAE (spectral constraint AAE), is based on the characteristics of HSIs to obtain better discrimination represented by hidden nodes. To be specific, we adopt a spectral angle distance into the loss function of AAE to enforce spectral consistency. Considering the different contribution rates of each hidden node to anomaly detection, we individually fuse the hidden nodes by an adaptive weighting method. A bi-layer architecture is then designed to suppress the variational background (BKG) while preserving features of anomalies. The experimental results demonstrate that our proposed method outperforms the state-of-the-art methods.Copyright © 2019 Elsevier Ltd. All rights reserved.
Exploiting embedding manifold of autoencoders for hyperspectral anomaly detection
[J].DOI:10.1109/TGRS.36 URL [本文引用: 1]
Spectral-spatial stacked autoencoders based on low-rank and sparse matrix decomposition for hyperspectral anomaly detection
[J].
A survey on density based clustering algorithms for mining large spatial databases
[J].
Robust sparse hyperspectral unmixing with l2,1 norm
[J].DOI:10.1109/TGRS.2016.2616161 URL [本文引用: 1]
Memorizing normality to detect anomaly:Memory-augmented deep autoencoder for unsupervised anomaly detection
[C]//
/
〈 |
|
〉 |
