作者简介: 成宝芝(1976-),男,博士,讲师,主要从事高光谱图像处理研究。Email:chengbaozhigy@163.com。
高光谱图像是一种新型的具有“图谱合一”特性的遥感图像,其连续的光谱曲线可更好地表达地表物质间的细微差异,在地表物质的分类、解混和目标探测等方面得到了广泛应用。随着高光谱遥感技术的深入发展,对不需要先验信息的异常目标检测的研究成为最活跃的方向之一,许多研究者提出了具有较好效果的异常检测算法。基于对国内外已有算法的综合归纳和分析,系统地论述了高光谱异常检测的研究现状和最新进展。阐述了高光谱异常目标检测的实质和基本理论; 从算法思想、关键技术和优缺点等方面重点分析总结了较有代表性的异常目标检测算法,并对其进行了概括和阐述; 最后对异常检测算法的未来研究方向进行了展望,力图为高光谱异常目标检测算法研究找到新的突破点。
Hyperspectral image is a new kind of remote sensing images with the feature of “combining mapping and spectra into one”,thus better expressing the subtle differences on the surface of the material through the continuous spectral curve. Hyperspectral images have a wide range of applications in such aspects as classification,unmixing and target detection. With the continuous development of hyperspectral remote sensing technology,anomaly target detection has become one of the most active direction of research because it doesn’t need a priori information. Many anomaly target detection algorithms have been proposed. Based on data available both in China and abroad,this paper summarized the research situation and new progress in anomaly detection algorithms. The author first expounded the essence of hyperspectral anomaly target detection and used the basic theory and then analyzed and summed up some representative anomaly detection algorithms in such aspects as the ideas of algorithm,key technology,advantages and disadvantages. On such a basis, the author summarized and described the evaluation method of anomaly detection and discussed the future development trend of anomaly target detection algorithm, with the purpose of finding new breakthroughs in the study of the algorithm of hyperspectral anomaly target detection.
从20世纪60年代开始, 遥感技术得到了迅速的发展。到了20世纪80年代, 由于成像光谱仪的研制成功和广泛应用, 出现了具有较高光谱分辨率的高光谱图像。近年来, 国内外研究人员在充分理解高光谱图像光谱特性和空间特性的基础上, 在地物分类(material classification)、光谱解混(spectral unmixing)和目标检测(target detection)等方面进行了深入研究, 取得了许多成果, 其中, 对实用性较强的高光谱异常目标检测(anomaly target detection)算法的研究和应用得到了特别的关注, 已成为高光谱图像研究的热点之一。异常目标检测的突出特点在于不需要对要检测的感兴趣目标的光谱提供任何先验信息, 在这种近似“ 盲状态” 的情况下, 通过异常检测可以在高光谱图像中发现一些相对于所在背景来说是“ 异常” 的目标。
高光谱图像异常检测的实质是一个二值假设检验问题, 通过衡量被检测点与所选择的背景光谱样本间的差异判决其属于目标还是背景。检测似然比(likelihood ratio, LR)的构造是检测过程最主要的环节, LR是异常目标检测的理论基础。给定一个观测光谱, 二值的LR检测利用条件概率密度函数判定像元是背景像元还是目标像元, 但在实际情况中, 条件概率密度函数所依赖的未知目标和背景参数很难得到。所以, 一般用最大似然估计来代替检测LR中的未知参数, 即广义LR检测(generalized likelihood ratio test, GLRT)[1]。这样, 就可以对预识别像元进行处理, 设置一定的阈值, 得到异常检测结果。
现有的异常目标检测算法主要从高光谱图像的背景信息分布模型、像元混合情况和非线性特性等几个角度展开的。本文从RX异常检测、混合像元异常检测和非线性异常检测等几个方面进行了研究, 其中典型的算法有传统的RX算法[2, 3]、核RX(kernel RX, KRX)算法[4]、支持向量数据描述(support vector data description, SVDD)算法[5]、基于光谱解译的RX算法[6]、基于背景残差数据的KRX异常检测算法[7]、基于聚类的异常检测算法[8]和混合像元条件下的异常检测算法[1, 9]等。以期对这些方法进行概括和阐述, 并对其发展方向进行展望, 为高光谱异常目标检测算法研究找到新的突破点。
传统的RX异常算法最初是由Reed和Yu等从多光谱图像的检测算法发展而来的, 在本质上可被看作主成分分析(principal component analysis, PCA)的逆过程。该算法将不符合背景统计特性的异常点判为目标, 是一种基于广义LR检验的恒虚警率异常检测(constant false-alarm rate, CFAR)算法[10, 11, 12]。在RX算法[13]中, 一般假设背景模型符合高斯分布统计特性, 虽然真实高光谱图像的背景分布可能与高斯分布有差异, 但是这种假设在统计特性上具有合理性。
在局部正态模型的基础上, RX算法在被检测像元的局部近邻中, 采用双窗口模式(包括同心嵌套的背景窗和目标窗)估计协方差和均值等参数。一般情况下, 背景窗口是外窗, 目标窗口是内窗, 且外窗要比内窗大很多, 窗口的边长一般都取奇数值。
RX算法实现的详细过程如下: 定义XB为包含M个像元的l× M背景矩阵, 每个被观测的光谱像元都可以表示为一个列向量XB, 即
XB=[x1, x2, …, xp] 。 (1)
RX算法区分目标的二值假设定义为
式中: a=0时H0成立, a> 0时H1成立; n为背景噪声向量; s=[s1, s2, …, sl]T为目标光谱向量(未知量)。
设r为观测数据, RX算法的判决表达式为
RX(r)=(r-
式中: η 为判决阈值, 其值大小与信噪比和虚警概率有关;
Ĉ b=
在真实数据中, M→ ∞ , 则RX算子简化为
RX(r)=(r-
式(6)为RX算子的一般形式, 在实际应用中大多采用此式。
传统的RX算法应用于高光谱异常检测也已取得了较好的效果, 而且该算法原理简单, 运行速度相对较快。但由于高光谱图像具有高维性、非线性等特点, 而RX算法对这类图像本身存在的问题处理的效果不好, 进而影响到异常目标检测精度的进一步提高, 故许多研究者对传统RX算法进行了改进和完善。Matteoli等[14, 15]提出了基于最小协方差行列式的RX算法(minimum covariance determinant RX, MCD-RX), 该算法从解决原始高光谱图像局部背景分布不完全符合均一高斯模型的情况出发, 利用最小协方差行列式改善背景分布中小样本数据的影响, 提高了传统RX算法的检测性能; 但MCD-RX算法在整个数据空间中都需要估计鲁棒性的协方差, 导致计算复杂度增加, 故Matteoli又对MCD-RX算法进行完善, 提出了峰度驱动的最小协方差行列式的RX(kurtosis driven MCD-RX, KMCD-RX)算法; 该算法首先对原始像元应用基于峰度的二值假设检验快速确定像元的邻域是否存在异常目标, 进而决定是否进行协方差的估计, 从而降低了计算复杂度。Molero[16]等则提出基于聚类的并行快速RX算法, 该算法从缩短异常检测时间出发, 通过聚类把具有相同特性的像元归为一类, 然后并行执行RX异常检测算子, 从而提高了RX异常检测的速度。Chang等[10]也从提高异常检测的时效性方面对传统RX检测算法提出了改进, 引入了目标区别测量的概念, 通过该方法利用聚类把不同的异常目标归到不同的目标类, 有效地提高了异常检测的性能。Ren等[17]基于样本数据中如果异常像元数量过多会使得样本协方差矩阵不能再代表背景分布的问题, 提出了一个加权的RX异常检测算法, 提高了传统RX算法的性能。Riley等[18]从区分背景数据是噪声还是真正的异常目标出发, 对RX异常检测算子进行重新构建, 利用噪声协方差阵对传统的欧氏矩阵加以改进, 构造成加权欧氏距离, 将其通过拉格朗日乘子法与RX异常检测器进行联合, 形成新的异常检测器; 该异常检测器在有效抑制噪声干扰的同时, 改善了传统RX异常检测器的性能。
近年来, Rossi等[19]为了提高RX算法异常检测的实时性, 提出了一个基于逐行处理更新策略架构的RX算法, 该算法依据线性代数学策略更新高光谱图像像元对应的逆矩阵的计算, 降低了计算复杂度, 提高了实时处理能力。Du等[20]对现有异常算法检测性能一方面易受检测窗或图像尺寸影响、另一方面对背景统计特性需要估计合适的窗口尺寸等问题进行研究, 提出了基于背景像元随机选择的异常检测算法, 在得到背景像元子集的基础上, 利用马氏距离完成异常检测; 相比于传统的RX等算法, 检测性能有很大改善。
由于成像光谱仪空间分辨率的限制和地物分布的复杂性, 高光谱图像中的像元可能会由不同地表物质构成的多个端元组成(即出现混合像元情况)。从混合像元角度出发分析高光谱数据分布情况, 可以得到更精确的异常目标检测结果。Stein[11]首先利用丰度估计的直方图特征识别相似目标的端元, 然后在丰度空间使用匹配滤波器检测存在的每一个目标端元, 从线性混合模型角度得到最终的异常检测结果, 通过仿真分析可以看出该算法具有较高的检测性能。李杰等[7]提出了基于背景残差数据的KRX异常检测算法, 通过提取背景端元抑制了背景干扰, 突出了异常目标信息; 在此基础上, 将残差数据非线性映射到高维特征空间, 再利用KRX算子完成目标检测, 降低了虚警率、提高了异常目标检测性能。成宝芝等[9]将光谱解混技术引入到支持向量数据描述的异常检测问题中, 实现了高光谱图像复杂背景信息和目标信息的分离, 使解混后的误差数据含有丰富的目标信息, 抑制了背景干扰, 同样取得了较好的检测结果。在考虑了高光谱图像的物理信息和统计信息的基础上, Broadwater等[21]在对高光谱图像进行异常检测时构造了线性混合模型, 并使用了多种检测器联合的方法检测子像元目标, 取得了较好的效果。
前文阐述的RX异常检测算法把目标和背景信息之间的关系设定为线性关系, 但是在有些情况下, 由于异常目标和背景信息的分离需要一个复杂的决策边界, 背景数据分布并不是总为高斯分布或者其他单峰状态的分布, 导致基于线性的异常检测方法性能变差; 另外, 高光谱图像波段间也存在着非线性的强相关性。近年来, 随着统计学习理论的快速发展和逐步完善, 使用非线性的核机器学习进行异常检测成为一个研究热点; 这类算法通过将原始高光谱数据非线性映射到高维的特征空间, 充分挖掘其隐含的非线性信息。通过核技巧将高维特征空间的内积运算转化为低维输入空间的核函数计算, 使得算法的处理过程变得简单[22]。这里主要介绍具有代表性的KRX, SVDD及据其改进的非线性异常检测算法。
1.3.1 KRX及其改进算法
经典的核RX算法(KRX)是Kwon等[4]在传统RX算法的基础上发展来的, 是一种非线性的RX算法[23, 24, 25]。KRX算法将原始数据XB通过非线性函数Ф 映射到高维特征空间, 即
Ф (XB)=[Ф (x1), Ф (x2), …, Ф (xM)] , (7)
式中: XB含有M个样本背景像元, 即XB=[x1, x2, …, xM]。
Ф (XB)是由两个高斯分布组成的, 建立特征空间中的二值假设, 即
式中: β =0时H0Ф 成立, β > 0时H1Ф 时成立; nΦ 为特征空间内的背景噪声向量; Φ (s)为目标光谱向量。
KRX算法的算子可以表示为
KRX[Ф (r)]=[Ф (r)-
式中:
Ĉ BΦ =VΦ Λ Φ
式中: Λ Φ =diag([λ 1, λ 2, …, λ M])为Ĉ BΦ 的M个非零特征值构成的对角阵; VΦ =[
通过式(9), 不需要具体的映射函数, 也不需要在高维的特征空间进行相应的点积运算, 只需要寻找一个合适的核函数来产生一个正定的Gram核矩阵, 就可以对原始高光谱数据进行KRX异常检测。
KRX算法充分利用了高光谱图像的非线性特性, 但也存在一些问题: ①计算复杂度高, 因为需要计算高阶的Gram矩阵及其逆矩阵; ②没有成熟的理论原则可以确定如何选择核函数及其参数。目前, 普遍采用的是高斯径向基(Gaussian radial basis function, Gaussian-RBF, RBF)核函数, 该核函数适合应用在异常目标检测问题中, 也能得到较好的检测结果; 但公式中涉及的参数的选择比较复杂, 需要经多次实验验证才能确定。因此, 研究人员又提出了很多基于KRX的的改进算法。赵春晖等[26]提出了核加权RX高光谱图像异常检测算法, 该算法从协方差矩阵准确表征背景数据分布出发, 通过加权的方法使协方差矩阵可以更好地符合背景数据分布, 从而提高背景分布的均一性, 改善了异常检测效果。胡春梅等[27]提出了基于背景误差累积的高光谱图像异常检测算法, 该算法首先构造一个背景子空间, 然后把各像元投影到该子空间, 使得背景得到有效抑制并突出了异常目标信息, 更好地降低了虚警率、提高了检测性能。梅峰等[28]提出了基于空域滤波的KRX异常检测算法, 该算法从改善背景信息分布特性出发, 首先把需要检测的高光谱图像利用中值滤波进行处理, 然后利用KRX进行异常检测, 在一定程度上改善了经典KRX算法的性能。胡春梅等[29]提出了基于目标正交子空间投影加权(target orthogonal subspace projection weighted, TOSPW)异常检测算法, 该算法从子空间角度出发, 首先估算背景协方差矩阵, 然后将每个像元投影到目标的正交子空间中, 并自适应地赋予每个像元合适的权值, 以减小背景特性估计受目标信息的影响, 从而检测到更多的异常目标、降低了虚警率。
史振威等[30]为了提高KRX算法在高光谱图像异常检测中的稳定性, 从规范背景协方差矩阵角度出发, 将核矩阵正则化, 提出了正则化的KRX算法。该算法同时考虑了原始线性空间和高维特征空间的异常检测结果, 使异常检测效果更加稳定。
1.3.2 SVDD及其改进算法
Banerjee等[5]最先提出了利用支持向量数据描述(SVDD)的高光谱图像异常检测算法。SVDD是一类分类器, 该算法通过发现一个含有训练数据的最小超球面估计支持区的训练数据, 寻找最小封闭超球包围具有共同特性的一类样本, 并用判别准则使这一类与其他类样本分开[31], 实现异常检测。
SVDD算法作为一种数据驱动算法, 不存在假设模型与数据实际分布特点不符的问题; 该算法将光谱信号映射到高维特征空间后, 利用核函数的性质进行异常点的检测, 较好地利用了高光谱图像波段间的非线性统计特性。但该算法在时效性差、计算复杂和核参数的选择复杂等方面存在不足, 为进一步提高其检测性能, 许多研究者对该算法进行了改进。Khazai等[32]从核参数的选择角度出发, 提出了自适应的SVDD异常检测算法, 该算法基于核函数的参数选择对性能的提高有重要的作用, 而又不容易确定的实际情况, 使用了一种自适应的几何解译的方法估计核参数的值, 提高了异常检测的性能。谌德荣[33]等为了解决SVDD对于局部异常目标检测精度不高的问题, 通过空间邻域聚类获取潜在的异常目标, 并根据检测的异常目标特点选择背景窗收集样本, 获取背景光谱的参数, 得到了结合空间邻域聚类分割的局部异常检测算法, 提高了传统SVDD算法的异常检测精度。梅峰等[34]为了更好地确定核参数, 提出了基于支持向量描述的自适应高光谱异常检测算法, 该算法通过局部背景分波段二阶分布统计, 对局部背景总体标准差与核参数的变化关系进行了分析, 构造了一个新的局部检测核参数— — 随检测背景不同而变化的核参数, 这种参数设定方法克服了传统的SVDD算法由于采用固定核参数带来的检测性能下降的问题。Gurram等[35]从核函数选择角度出发, 提出了一个基于稀疏核的SVDD高光谱图像异常检测算法, 该算法是从基于稀疏核的集成学习(sparse kernel-based ensemble learning, SKEL)发展来的。SKEL算法把给定的一个多元数据集表示的常态特征随机二次抽样到特征子空间, 在各个特征子空间重建的再生核希尔伯特空间(reproducing kernel Hilbert space, RKHS)中, 定义了一个支持常态数据的封闭的超球面, 该算法相比于传统的SVDD算法提高了检测性能。针对传统SVDD算法计算时间较长的缺点, Khazai等[36]提出了一个快速自适应SVDD异常检测算法, 该算法包括聚类、背景模型化和自动异常检测3个过程, 与全局性的SVDD异常算法相比, 检测性能和计算复杂度方面都有很大提高。另外, 谌德荣等[37]针对基于SVDD异常检测算法存在计算量巨大等问题, 提出了基于样本分割的快速高光谱图像异常检测SVDD方法, 通过样本分割降低SVDD用于局部异常检测的计算量, 也取得了较好的异常检测效果。
1.3.3 采用核方法的其他非线性算法
近年来, 还有一些研究者提出了新的采用核函数的非线性异常检测算法。例如: Zhao等[38]提出的利用核独立成分分析(kernel independent component analysis, KICA)进行特征提取的高光谱异常检测算法; Goldberg等[39] 提出的在高维特征空间利用特征值分解方法实现小目标的异常检测。总的来说, 利用非线性方法特别是核方法进行异常目标检测, 还有很多问题需要研究。无论是发现新的核方法, 或者是把已有的线性方法“ 核化” , 都是值得研究的方向。
1.4.1 高斯马尔科夫随机场模型
RX算法存在的基础是建立在背景信息分布属于局部正态分布模型(local normal model, LNM)。由于真实高光谱数据分布的复杂性, 存在背景信息分布不一致的问题; 另外, 算法中涉及的高阶协方差矩阵及其逆矩阵求解的计算复杂度高, 影响了算法的实时性。因此, Schweizer等[40, 41]在RX算法基础上, 提出了基于LNM的利用高斯马尔可夫随机场(Gaussian Markov random field, GMRF)对高光谱数据进行建模, 求解异常目标问题。该算法考虑了高光谱图像的空间相关性, 使用1个三维的一阶马尔可夫随机场(Markov random field, MRF)对背景信号建模。该算法相对于RX算法的优点在于可直接得到波段协方差阵逆阵的估计, 避免高阶矩阵求逆过程的困难。GMRF协方差的逆矩阵仅用4个参数就可以描述, 使用小尺寸的估计窗就可以得到可靠的逆矩阵估计, 因而减少了估计窗中的背景分布不一致的可能。
1.4.2 子空间技术
子空间算法首先在高光谱图像中寻找背景的光谱特征, 然后利用子空间投影等方法进行异常检测。低概率检测(low probability detection, LPD)[42]异常目标算法是其中最重要的方法之一, 它通过构建正交子空间, 并投影原始高光谱数据于其上, 达到抑制背景信息、突出异常目标, 最终利用背景与目标之间的对比度增大达到检测出异常目标的目的。王玉磊等[43]也从子空间分割角度出发, 利用基于特征融合的LPD算法进行异常目标检测, 取得了较好的异常检测结果。
1.4.3 概率密度估计
He等[44]对于异常检测中背景分布模型非均匀一致的问题进行分析, 提出了基于最大熵和非参数估计的高光谱异常检测算法。该算法通过高光谱数据样本得到数据的统计信息, 而不需要知道数据的统计模型, 通过仿真得到的异常目标检测结果优于传统的RX算法。
对异常检测算法性能进行评价的一个重要指标是接收机操作特性(receiver operating characteristic, ROC)曲线。ROC用于描述检测概率与虚警概率之间的变化关系[45]。根据地面目标真实分布图可以获得每个目标所包含的像元区域坐标, 异常目标和虚警的区分通过分析检测到的异常点是否处于真实图的目标区域之内来判断, 如落入其内, 则认定为异常目标, 反之则为虚警。将检测概率Pd定义为检测到的真实目标像元数目Nhit与地面真实目标像元数目Ntarget的比值, 虚警概率Pf定义为检测到的虚警像元数目Nfalse同整幅图像像元数目总和Ntotal的比值[1, 34], 即
Pd=Nhit/Ntarget , (11)
Pf=Nfalse/Ntotal 。 (12)
通过比较各算法的ROC曲线, 就能对各算法的异常目标检测性能进行评估。另外, 异常目标检测算法能检测到的目标个数、目标所占像元数和虚警所占像元数等3个统计结果, 也是对各算法性能进行评价的重要指标。
随着遥感科学技术的不断发展, 高光谱图像处理技术已经得到广泛重视和深入研究。由于地表物质的多样性和光谱分布的复杂性, 尽管异常目标检测技术有了快速的发展, 但是仍存在许多问题。从未来研究的角度来看, 高光谱异常检测技术需要关注和解决的问题有:
1)现有的算法在光谱特性方面研究的比较深入。但是, 随着成像光谱仪硬件技术和核心软件的不断进步, 高光谱图像在空间分辨率方面也有了很大提高, 如何更好地结合高光谱图像的光谱特性和空间特性进行异常目标检测值得关注。
2)在异常目标检测中, 非线性核方法的引入取得了很好的效果, 许多研究者也在不断对原来非核的异常检测算法进行核化, 并也都很好地改善了原有算法的异常检测性能。目前, 核方法中的核函数普遍采用的是RBF核函数, 该函数用于异常检测在一定程度上也具有优良的性能。但是通过对高光谱图像光谱和空间特性的分析, 在充分理解其复杂性的基础上, 是否能找到一个更好的核函数(或者合理设定RBF核函数的参数)用于异常目标检测, 提高算法的性能, 也是一个需要深入研究的难点。
3)高光谱图像波段多, 在带来丰富的地物信息的同时, 也给异常检测算法引入了“ 维数灾难” 问题。所以, 寻找更好的特征提取和降维技术是一件有重要意义的事情。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
|
[45] |
|