基于变分模态分解的SAR图像目标识别方法
Target recognition in SAR images based on variational mode decomposition
责任编辑: 张仙
收稿日期: 2019-06-14 修回日期: 2019-11-25 网络出版日期: 2020-06-15
基金资助: |
|
Received: 2019-06-14 Revised: 2019-11-25 Online: 2020-06-15
作者简介 About authors
周光宇(1963-),男,硕士,副教授,研究方向为嵌入式系统,图像处理,传感网络。Email:happyday_zh@163.com。 。
为提升合成孔径雷达(synthetic aperture Radar,SAR)目标识别性能,提出基于变分模态分解算法(variational mode decomposition,VMD)的SAR图像目标识别方法。首先采用二维变分模态分解算法(bidimensional VMD,BVMD)对SAR图像进行分解,从而获得多模态的表示; 然后采用联合稀疏表示对SAR图像的多模态特征进行同时表征; 最后基于最小重构误差的原则判定目标类别。在MSTAR数据集上对提出方法进行性能测试,结果显示,在标准操作条件(standard operating condition,SOC)下对10类目标的识别率达到99.24%,在型号差异、俯仰角差异、噪声干扰条件下的性能也优于现有几类方法,证实了方法的有效性。
关键词:
In order to improve synthetic aperture Radar (SAR) target recognition performance, the authors propose a method based on variational mode decomposition (VMD). First, the bidimensional VMD (BVMD) is employed to decompose SAR images, thus obtaining multi-mode representations. Afterwards, the joint sparse representation is employed to represent the multiple modes. Finally, the target label is determined based on the minimum reconstruction error. The proposed method was tested on the MSTAR dataset. It could achieve a recognition rate of 99.24% on 10 classes of targets under the standard operating condition (SOC). In addition, its performance outperforms some other SAR target recognition methods under configuration variance, depression angle variance, and noise corruption. The results have confirmed the validity of the proposed method.
Keywords:
本文引用格式
周光宇, 刘邦权, 张亶.
ZHOU Guangyu, LIU Bangquan, ZHANG Dan.
0 引言
合成孔径雷达(synthetic aperture Radar,SAR)具备在全天时、全天候条件下工作的能力,可为对地观测提供高分辨率图像。SAR目标识别技术旨在对获取的场景图像中的潜在目标进行分析并判断其类别。典型的SAR目标识别可分为检测、鉴别和识别3个阶段。前2个阶段完成从复杂SAR图像场景中获得感兴趣目标的图像切片,提出自然以及人造杂波带来的虚警。具体的SAR目标识别算法一般包括特征提取和分类识别2个环节[1,2]。特征提取对于SAR目标识别性能有着重要影响。当前,应用于SAR目标识别的特征主要可分为几何特征、变换域特征和电磁特征。几何特征描述SAR图像中目标的外形和几何结构等信息,如轮廓、边缘、区域、尺寸等[3,4,5,6]。文献[3,4]采用目标区域进行识别算法设计; 文献[5]构造若干描述目标外形的描述子进行目标鉴别和分类。变换域特征通过矩阵投影、信号分析等手段获取原始图像的不变特征[7,8,9,10,11,12]。文献[7,8,9]分别通过主成分分析(principal component analysis,PCA)、核主成分分析(kernel PCA,KPCA)、非负矩阵分解(non-negative matrix factorization,NMF)等手段构造投影矩阵,实现SAR图像降维压缩; 文献[10,11]分别通过小波分解、单演信号等信号分解算法提取SAR图像特征。电磁特征描述SAR目标的电磁散射特性,如极化方式、散射中心等。文献[13,14,15]基于属性散射中心模型提取SAR图像散射中心并设计匹配算法用于目标识别。分类器根据特征的类型和特点进行相应选取或设计。常用的分类器包括K近邻(K-nearest neighbor,K-NN)[7],支持向量机(support vector machine,SVM)[16],稀疏表示分类(sparse representation-based classification,SRC)[17]以及深度神经网络[18,19]等。值得注意的是,只有当分类器与提取的特征具有良好的适应性时,最终的分类结果才能达到较高的水平。
变分模态分解(variational mode decomposition,VMD)作为一种新的模态分解方法,通过构造并求解约束变分问题对原始信号进行可靠分解[20]。相比以往的信号分解算法,该方法具有更为牢固的数学理论基础以及较高的运算效率,弥补了传统信号分解手段存在的一些不足。当前VMD已经在机械、语音等信号分析中得以成功运用[21,22]。为了将VMD的优良性能引入图像分析领域,研究人员提出二维变分模态分解(bidimensional VMD,BVMD)算法,并在图像增强、去噪中进行了运用和验证[23]。经过BVMD得到的多模态表示可以有效表征原始图像的高、低频特性,从而分层次地反映出图像的主要信息和细节信息。针对SAR目标识别这一应用,本文通过联合BVMD获得的多模态表示进行SAR图像特征提取并在具体分类阶段采用联合稀疏表示对多模态表示进行联合表征。联合稀疏表示在进行单个任务重构的同时考察了不同任务之间的联系,有利于提高整体的重构精度。最后,根据各个类别的重构误差大小判定待识别目标的类别。实验中,基于MSTAR数据集设置测试条件验证提出方法的有效性。
1 VMD算法
作为一种自适应信号分解算法,VMD能够高效分解信号中的各个模态并确定其相关频带[20]。其分解过程实际就是求解变分问题,可概括为变分问题的构造和求解2个阶段。
1.1 变分问题的构造
变分问题的实质是将输入信号x(t)分解为具有有限带宽的K个模态uk(k=1,2,…,K)。为此,首先采用Hilbert变换获得各个模态的解析信号; 然后将其调制至基带上; 最后通过对解调信号进行梯度平方(L2)范数求解,估计各模态对应的带宽。变分问题的基础表达式为
式中: k为模态的个数; δ(·)为冲击函数; t为自变量; j为虚数单位; uk={u1,u2,…,uK}为所有模态的集合; wk={w1,w2,…,wK}为各个模态的中心频率。
1.2 变分问题的求解
为了使公式(1)中的约束优化问题转换为非约束优化问题,通常采用二次罚项和拉格朗日乘子算法。其中,二次罚项的引入可以保证重构信号的精度并且能提高对噪声干扰的稳健性。扩展得到的拉格朗日表达式为
式中: λ(t)为拉格朗日乘子; α为二次惩罚因子。
利用乘子交替方向法(alternating direction method of multipliers,ADMM)对
式中: X代表可能的模态集合,wk与
根据Parseval傅里叶等距变换原理,公式(3)可由时域变换到频域从而获得各个模态的频域,即
式中:
采用类似的思路得到
式中:
根据以上分析,VMD算法的中模态求解的具体更新步骤如下:
1)初始化{
2)分别根据公式(3)和公式(5)对uk和wk进行更新;
3)通过公式
对λ进行更新,其中τ为大于0的系数;
4)对于预设的判别精度ε>0,若
考虑到原始的VMD仅针对一维信号有效,研究人员将其推广到二维,开发了BMVD并在图像处理领域进行了应用和验证。BMVD的原理与VMD基本相同[23],其求解过程也基本相似,故在此处不再进行详细介绍。本文采用BMVD对SAR图像进行分解,获得其多模态表示。多模态表示中的低频部分主要反映原始图像的主要信息,如目标区域等; 高频部分则反映图像中的细节信息,如目标轮廓、边缘等。因此,通过结合多模态表示可以更为充分地描述目标特性,从而为后续分类提供有力支撑。
2 联合多模态稀疏表示的目标识别方法
2.1 联合稀疏表示
传统的稀疏表示分类多针对单一输入的情形,通过对输入的信号、图像(或其特征)进行全局字典下的重构判断最佳判决类别。联合稀疏表示是在稀疏表示的基础上衍生发展出来的,可以同时考虑多个输入情况下的稀疏表示问题。此外,若不同输入之间存在关联,该算法还可以在重构过程中引入这种关联提高整体的表征精度。对于待识别目标y的表示集[y(1),y(2),…,y(M)](如,同一目标的不同视角、不同特征等),联合稀疏表示旨在使它们的总体重构误差达到最小,即
式中: g(·)为目标函数; [y(1),y(2),…,y(M)]为目标表示; A(k)为对应于y(m)(m=1,2,…,M)的全局字典; χ(m)为相应的稀疏表示系数矢量; β=[χ(1)χ(2)…χ(M)]为稀疏系数矩阵。
公式(6)中的目标函数仍然是在独立考察各个分量的稀疏表示问题。实际上,同一目标的不同视角或特征等表示存在一定的内在关联,通过考察这种关联有利于提高真实的重构精度。当前常用的联合稀疏表示算法多采用下式对稀疏系数矩阵进行约束,达到考察不同任务之间关联的目的,公式为
式中
式中:
2.2 识别流程
本文采用联合稀疏表示对测试样本中分解得到的多模态表示进行联合表征,进而根据计算的重构误差判定其归属类别。具体实施中,通过对多幅SAR图像进行变分模态分解及图像重构,发现前3个模态的平均重构能量达到95%左右。因此,本文认为前3个模态对于描述SAR图像的目标特性最为重要,余下的模态很可能是图像中噪声或者杂波影响的结果。
根据上述分析,本文设计的识别算法流程如图1所示。对于所有测试样本,采用BVMD进行分解,获得其前3个模态的结果,并分别构建字典。在测试阶段,对于待识别的样本,采用与训练样本相同的算法进行相应的多模态分解; 然后,利用联合稀疏表示对测试样本的多模态表示进行联合表征,通过SOMP算法求解各个模态对应的稀疏表示系数,进而分别计算各个训练类别对于测试样本的重构结果; 最终,根据最小误差原则判定测试样本的类别。
图1
图1
基于变分模态分解的SAR目标识别方法流程
Fig.1
Procedure of SAR target recognition based on variational mode decomposition
3 实验与分析
3.1 数据集介绍
采用MSTAR数据集对提出方法进行性能测试实验。该数据集采集了包括坦克、装甲车、运输车等10类具有相近外形的地面军事目标SAR图像,空间分辨率达到0.3 m。图2展示了10类目标的光学图像及名称。MSTAR数据集中包含了各类目标在不同俯仰角下的SAR图像,如15°,17°,30°,45°等。此外,部分目标包括多个子型号的SAR图像,如BMP2,T72。因此,基于该数据集可以设置丰富的实验场景对提出方法进行全面测试。测试过程中,选用几种现有的SAR目标识别算法与本文方法进行对比,包括基于SVM的方法,基于SRC的方法,基于卷积神经网络(convolutional neural network,CNN)的方法以及文献[12]中基于单演信号特征的方法。其中,SVM方法采用PCA进行特征提取; SRC方法采用随机投影进行降维; CNN基于像素灰度进行训练分类; 单演信号方法则是采用多尺度单演信号谱特征进行识别。后续验证中,首先在标准操作条件(即,测试样本与训练样本相似度较高)展开测试; 接着,设置了若干典型扩展操作条件(standard operating condition,SOC)(即,测试样本与训练样本差异较大)进行了测试。
图2
3.2 测试结果与分析
3.2.1 SOC条件
表1给出了基于MSTAR数据集设置的一种典型的SOC条件。训练集和测试集分别来自15°和17°俯仰角,两者之间仅存在很小的俯仰角差异,因此可以保持较高的相似性。采用本文方法对这10类目标进行识别,得到如表2所示的混淆矩阵。可以看出,各类目标的正确识别率均保持在98.5%以上,10类目标的平均识别率为99.24%,显示了本文方法在当前条件下的优异性能。表3对比了相同的硬件条件下,各类方法的识别性能,包括对10类目标的平均识别率以及识别单个测试样本所需要的平均时间消耗。各类方法均可以在标准操作条件下均获得很好的识别性能。CNN和单演信号方法与本文方法较为接近,均达到了99%以上。在效率方面,相比简单的SVM和SRC方法,本文方法由于引入了变分模态分解以及联合稀疏表示,平均时间消耗有所增加,但与单演信号法和CNN方法相比效率相对较高。综合识别精度和效率2方面,本文方法在标准操作条件下的整体识别性能具有一定的优势。
表1 SOC条件实验设置
Tab.1
类别 | 训练集图像数量/幅 | 测试集图像数量/幅 |
---|---|---|
BMP2 | 233 | 195 |
BTR70 | 233 | 196 |
T72 | 232 | 196 |
T62 | 299 | 273 |
BRDM2 | 298 | 274 |
BTR60 | 256 | 195 |
ZSU23/4 | 299 | 274 |
D7 | 299 | 274 |
ZIL131 | 299 | 274 |
2S1 | 299 | 274 |
表2 SOC条件下本文方法的混淆矩阵
Tab.2
类别 | BMP2 | BTR70 | T72 | T62 | BDRM2 | BTR60 | ZSU23/4 | D7 | ZIL131 | 2S1 |
---|---|---|---|---|---|---|---|---|---|---|
BMP2 | 0.985 | 0 | 0.005 | 0.010 | 0 | 0 | 0 | 0 | 0 | 0 |
BTR70 | 0 | 1.000 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
T72 | 0 | 0 | 0.985 | 0 | 0.005 | 0 | 0.005 | 0 | 0 | 0.005 |
T62 | 0 | 0.004 | 0 | 0.989 | 0 | 0 | 0 | 0 | 0 | 0.007 |
BDRM2 | 0 | 0 | 0 | 0 | 0.996 | 0 | 0 | 0 | 0.004 | 0 |
BTR60 | 0 | 0 | 0 | 0.010 | 0 | 0.990 | 0 | 0 | 0 | 0 |
ZSU23/4 | 0 | 0 | 0 | 0 | 0 | 0 | 0.993 | 0 | 0 | 0.007 |
D7 | 0.004 | 0.004 | 0 | 0 | 0.007 | 0 | 0 | 0.985 | 0 | 0 |
ZIL131 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1.0 | 0 |
2S1 | 0.004 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.003 | 0.993 |
表3 SOC条件下平均识别率和平均时间消耗
Tab.3
方法类型 | 平均识别率/% | 平均时间消耗/ms |
---|---|---|
本文方法 | 99.24 | 75.4 |
SVM | 96.94 | 69.5 |
SRC | 97.26 | 62.7 |
CNN | 99.08 | 78.6 |
单演信号法 | 99.10 | 80.1 |
3.2.2 型号变化
地面车辆目标可以通过局部结构的变化进行改进变种,从而衍生出多个子型号。它们的整体结构保持一致但存在局部细节差异。考虑到训练样本的有限性,训练集通常只包含目标的单一型号。表4给出了2类目标存在型号变化条件下的训练集和测试集,括号中为目标型号,BMP2和T72的测试样本与训练样本来自完全不同的型号,BTR70作为混淆类别,提升整体识别难度。表5列出了各类方法在此条件下的平均识别率。相比SOC条件,各类方法的性能均有下降。总体上,各类方法的识别率仍保持了较高的水平,主要是因为当前设置的型号差异不够明显,这与现有文献中的结果保持一致[12,13,14]。本文方法的识别率最高,表明其对于型号变化具有更强的适应性。基于BVMD分解得到的多模态表示能够更好地反映目标的细节信息,有利于对型号变化造成的和局部变化进行可靠判决。
表4 型号差异下实验设置
Tab.4
类别 | 训练集图像数量/幅 | 测试集图像数量/幅 |
---|---|---|
BMP2 | 233(Sn_9563) | 196(Sn_9566) 196(Sn_c21) |
BTR70 | 233(Sn_c71) | 196(Sn_c71) |
T72 | 232(Sn_132) | 195(Sn_812) 191(Sn_s7) |
表5 型号差异下平均识别率
Tab.5
方法类型 | 平均识别率/% |
---|---|
本文方法 | 97.82 |
SVM | 94.58 |
SRC | 95.72 |
CNN | 96.07 |
单演信号法 | 97.14 |
3.2.3 俯仰角变化
SOC条件下,训练集样本和测试集样本俯仰角差异很小,两者的相似度较高。然而,随着测试集和训练集俯仰角变化程度的加剧,两者的差异也会逐渐增大,导致识别问题的难度加大。表6给出了带有较大俯仰角差异的训练和测试集,3类目标17°俯仰角的SAR图像作为训练集,测试样本则分别来自30°和45°俯仰角。通过在2个俯仰角下分别进行测试,获得不同方法的性能对比如图3所示。本文方法在2个角度下均取得最高的识别率,显示其对于俯仰角变化的稳定性。在较大俯仰角差异的情况下,同一目标的2幅图像之间存在局部的“畸变”,但仍然存在当前目标的共同特性。采用BVMD分解得到的多模态表示可以有效地反映这种共性特征,从而为正确分类提供支撑。
表6 俯仰角变化下实验设置
Tab.6
类型 | 俯仰角 | 2S1 | BDRM2 | ZSU23/4 |
---|---|---|---|---|
训练集图像 数量/幅 | 17° | 299 | 298 | 299 |
测试集图像 | 30° | 288 | 287 | 288 |
数量/幅 | 45° | 303 | 303 | 303 |
图3
图3
俯仰角变化条件下平均识别率
Fig.3
Average recognition rates under depression angle variance
3.2.4 噪声干扰
噪声广泛存在于自然界,是图像处理领域中一个不可回避的问题。SAR目标识别算法的噪声稳健性直接制约着其在真实环境中的实用性。文献[7,13]等算法针对噪声干扰条件下的SAR目标识别问题进行了研究和测试,表明了噪声对于目标识别性能具有较为显著的影响。本文按照上述文献的思路对表1中的测试样本进行噪声干扰实验,测试各方法随信噪比(signal-noise ratio,SNR)变化的性能曲线,如图4所示。对比可见,SVM和CNN方法随SNR降低的性能下降最为剧烈,噪声稳健性较差。其余3类方法均是基于稀疏表示的分类机制,表明了稀疏表示对于噪声具有一定的稳健性。本文方法在各噪声水平下均获得最佳性能,验证其对于噪声干扰更强的稳健性。BVMD在进行图像分解过程中实际已经考虑了噪声影响(尤其是加性高斯噪声),分解得到的多模态本身就剔除了部分的噪声干扰。因此,通过结合BVMD多模态表示与联合稀疏表示进一步提高了噪声稳健性。
图4
图4
各类方法在噪声干扰下的性能
Fig.4
Performance of different methods under noise corruption
4 结论
本文提出基于变分模态分解的SAR图像特征提取方法并应用于目标识别中,得到如下结论:
1)基于BVMD分解得到的多模态表示更为充分地反映了SAR图像中的目标特性,为后续分类提供了有效信息。联合稀疏表示基于多任务学习的思想对多模态表示进行统一表征,有利于提高真实重构精度,从而增强重构误差区分不同类别的能力。因此,本文方法通过特征和分类器的有机组合提高了最终的分类性能。
2)采用MSTAR数据集设置多种测试条件展开实验,本文方法在SOC条件下对10类目标可以取得99.24%的平均识别率,在型号差异条件下对3类目标的平均识别率为97.82%,在30°和45°俯仰角下对3类目标的平均识别率分别为96.91%和73.27%,在噪声干扰条件下的识别性能优于其他对比方法。通过实验结果的对比可知,本文方法的综合识别性能优于选取的4类对比方法。
参考文献
Automatic target recognition in synthetic aperture Radar imagery:A state-of-the-art review
[J].
基于三维电磁散射参数化模型的SAR目标识别方法
[J].
SAR ATR based on 3D parametric electromagnetic scattering model
[J].
Automatic target recognition of synthetic aperture Radar(SAR) images based on optimal selection of Zernike moment features
[J].
Target recognition in synthetic aperture Radar images using binary morphological operations
[J].
New discrimination features for SAR automatic target recognition
[J].
SVM-based target recognition from synthetic aperture Radar images using target region outline descriptors
[J].
SAR图像多层次正则化增强及在目标识别中的应用
[J].
Multi-level SAR image enhancement based on regularization with application to target recognition
[J].
结合KPCA和稀疏表示的SAR目标识别方法研究
[J].
Research on the synthetic aperture Radar target recognition based on KPCA and sparse representation
[J].
Target recognition in synthetic aperture Radar via non-negative matrix factorization
[J].
基于小波变换和深层稀疏编码的SAR目标识别
[J].
SAR target recognition using wavelet transform and deep sparse autoencoders
[J].
SAR target recognition via joint sparse representation of monogenic signal
[J].
属性散射中心匹配及其在SAR目标识别中的应用
[J].
Matching of attributed scattering center and its application to synthetic aperture Radar automatic target recognition
[J].
A robust similarity measure for attributed scattering center sets with application to SAR ATR
[J].DOI:10.1016/j.neucom.2016.09.007 URL [本文引用: 2]
A SAR ATR method based on scattering centre feature and bipartite graph matching
[J].
Decision fusion of sparse representation and support vector machine for SAR image target recognition
[J].
Sparse representations for automatic target classification in SAR images
[C]//
Target classification using the deep convolutional networks for SAR images
[J].
Convolutional neural network with data augmentation for SAR target recognition
[J].
Variational mode decomposition
[J].
基于变分模态分解和小波分析的语音信号去噪方法
[J].
Speech signal denoising based on VMD and wavelet analysis
[J].
基于变分模态分级的和去趋势波动分析的柴油机振动信号去噪方法
[J].
Vibration signal denoising method of diesel engines based on VMD and DFA
[J].
基于二维变分模态分解和自适应中值滤波的图像去噪方法
[J].
Image denoising method based on bi-dimensional variational mode decomposition and adaptive median filtering
[J].
Multi-view automatic target recognition using joint sparse representation
[J].
Multitask compressive sensing
[J].
/
〈 |
|
〉 |
