自然资源遥感, 2024, 36(3): 137-145 doi: 10.6046/zrzyyg.2023109

技术方法

改进Transformer的高光谱图像地物分类方法——以黄河三角洲为例

李薇,1, 樊彦国,1, 周培希2

1.中国石油大学(华东)海洋与空间信息学院,青岛 266580

2.青岛弘毅天图信息科技有限责任公司,青岛 266555

Improved Transformer-based hyperspectral image classification method for surface features: A case study of the Yellow River Delta

LI Wei,1, FAN Yanguo,1, ZHOU Peixi2

1. College of Oceanography and Space Informatics,China University of Petroleum(East China),Qingdao 266580, China

2. Qingdao Hongyi Tiantu Information Technology Co., Ltd., Qingdao 266555, China

通讯作者: 樊彦国(1965-),男,博士,教授,主要从事3S技术在数字国土、城市及海岸带方向的教学与研究工作。Email:ygfan@upc.edu.cn

责任编辑: 张仙

收稿日期: 2023-04-18   修回日期: 2023-08-15  

基金资助: 自主创新项目-战略专项项目“退化生态系统土壤典型指标在线监测技术”(24720221004A-3)
科技揭榜专项项目“基于多源数据的胶州湾湿地生态演变分析”(2021-34)
国家自然科学基金项目“黄海海水透明度时空演化规律及其影响机理研究”(42106172)

Received: 2023-04-18   Revised: 2023-08-15  

作者简介 About authors

李 薇(2000-),女,硕士研究生,主要研究方向为深度学习与遥感应用。Email: s21160030@s.upc.edu.cn

摘要

高光谱技术已成为沿海湿地监测的主要手段,但传统高光谱分类方法通常存在特征提取不充分、同物异谱和场景碎片化等问题。针对这些问题,该文将Transformer用于高光谱分类,提出一种新的分类方法。该方法基于视觉自注意力模型(Vision Transformer,ViT),利用Non-local技术学习全局空间特征,扩大感受野解决提取判别特征不足的问题; 同时,通过自适应跨层残差连接加强层间信息交换,解决信息损失的问题。选取NC16和NC13黄河三角洲湿地数据集作为实验数据,并将提出的方法与支持向量机(support vector machine,SVM)、一维卷积神经网络(one dimensional convolution neural network,1DCNN)、上下文深度卷积神经网络(contextual deep convolution neural network,CDCNN)、光谱空间残差网络(spectral-spatial residual network,SSRN)、混合光谱网络(hybrid spectral network,HybridSN)和ViT进行比较分析。结果表明,所提方法的总体精度(overall accuracy,OA)、平均精度(average accuracy,AA)和Kappa系数均有显著提高,OA分别达到96.24%和73.84%,AA分别达到83.42%和74.87%,Kappa分别达到94.80%和68.94%。

关键词: 高光谱; 湿地分类; Transformer; 非局部空间特征

Abstract

Hyperspectral technology has become the major means of coastal wetland monitoring. However, traditional hyperspectral classification methods usually face challenges such as insufficient feature extraction, the same surface features corresponding to different spectra, and fragmented scenes. To solve these problems, this study proposed a new classification method by applying Transformer to hyperspectral classification. This vision Transformer (ViT)-based method expanded the receptive field by learning global spatial features using non-local technology, thus overcoming the insufficient extraction of discriminant features. Meanwhile, this method enhanced the cross-layer information interchange through cross-layer adaptive residual connection, thus eliminating information loss. This study, taking NC16 and NC13 wetland datasets of the Yellow River Delta as experimental data, compared the classification method proposed in this study to support vector machine (SVM), one-dimensional convolution neural network (1DCNN), contextual deep convolution neural network (CDCNN), spectral-spatial residual network (SSRN), hybrid spectral network (HybridSN), and ViT. The comparison results show that the new method yielded significantly elevated overall accuracy (OA) of up to 96.24% and 73.84%, average accuracy (AA) reaching 83.42% and 74.87%, and Kappa coefficients of up to 94.80% and 68.94%, respectively for the two datasets.

Keywords: hyperspectral; wetland classification; Transformer; non-local spatial feature

PDF (10380KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

李薇, 樊彦国, 周培希. 改进Transformer的高光谱图像地物分类方法——以黄河三角洲为例[J]. 自然资源遥感, 2024, 36(3): 137-145 doi:10.6046/zrzyyg.2023109

LI Wei, FAN Yanguo, ZHOU Peixi. Improved Transformer-based hyperspectral image classification method for surface features: A case study of the Yellow River Delta[J]. Remote Sensing for Land & Resources, 2024, 36(3): 137-145 doi:10.6046/zrzyyg.2023109

0 引言

湿地是全球价值最高的生态系统,被誉为“地球之肾”、物种宝库、储碳库和气候变化的调节器,在孕育和丰富世界生物多样性领域中发挥了至关重要的作用。准确的沿海湿地监测对水资源保护[1]、生物多样性保护[2]和蓝碳碳汇开发[3]具有重要意义。湿地分类可以为制定湿地保护计划和保护湿地物种多样性提供必要的参考信息。由于不同地面物体的光谱相似性,并且存在严重的碎片化和空间异质性,沿海湿地测绘仍是一大挑战。随着我国遥感研究的迅猛发展,高光谱已成为众多遥感技术中最重要的方向之一,高光谱图像(hyperspectral images,HSI)包含几十甚至上百个波段,真正实现了图谱合一[4-5]。目前,HSI已经在许多领域取得了广泛的应用,如医学图像处理、土地测绘、精准农业、食品检测、气象监测、矿物勘探等[6]。遥感监测技术具有省时、省力、对湿地无破坏性采样、快速宏观监测等优势,已成为目前获取大面积湿地信息的主要途径。近年来,基于遥感的湿地分类工作越来越多。

HSI分类是针对HSI的一项基础研究,传统的分类模型在处理小样本问题中表现良好,但是当训练集增大时并不能挖掘出图像的深层信息而出现性能瓶颈,采用深层结构的模型能够充分利用影像的空间光谱信息。目前,图像分类中主流的技术是深度神经网络,如堆叠自编码器(stacked autoencoder,SAE)、卷积神经网络(convolutional neural networks,CNN)、循环神经网络(recurrent neural networks,RNN)等[7-12]。SAE需要数据被处理成一维数据,分层提取图像的深层特征,忽视了HSI的空间信息,影响分类精度。在基于CNN的高光谱分类方法中,一维卷积神经网络(one dimensional convolution neural network,1DCNN)是一种单分支光谱分类方法,它只考虑光谱信息而忽略空间信息; 上下文深度卷积神经网络(contextual deep convolution neural network,CDCNN)方法利用多尺度卷积滤波器实现了光谱和空间信息的联合利用,并利用残差连接的方法引入了更高更深的网络; 光谱空间残差网络(spectral-spatial residual network,SSRN)利用残差连接和三维卷积核构建了深度残差网络模型,能够利用深层次的空谱联合特征,相较于1DCNN和CDCNN方法的分类精度有所提高; 混合光谱网络(hybrid spectral network,HybridSN)利用三维卷积和二维卷积联合提取光谱和空间特征。RNN无法并行训练模型,限制了实际应用中的分类性能。

随着分类方法的深入发展,Transformer模型成为当前主要的神经网络模型之一,由于使用了多头自注意力机制,通过位置编码来捕获全局序列信息,可以更有效地处理和分析序列数据[13]。Hong等[14]将Transformer模型应用到HSI分类,采用分组光谱嵌入和层与层之间自适应融合的方式,对光谱波段进行分组,学习分组相邻波段的高级特征,在公开数据集中实现较好的分类结果; Zhong等[15]设计了一个光谱空间变压器网络(spectral-spatial transformer network,SSTN),用注意力模块取代了卷积操作。许多湿地分类研究也采用了Transformer模型,例如,Liu等[16]提出利用2个Transformer深度网络融合局部和全局特征的HSI分类方法,用于绘制ZY1-02D卫星图像的沿海湿地; Gao等[17]设计了空间光谱视觉自注意力模型(spatial-spectral Vision Transformer,SSViT)从融合图像中提取序列关系,对土地植被覆盖和生物数据进行一致分析,揭示了底栖生物的分布规律。研究表明,采用Transformer模型有助于湿地HSI分类。但是,在前人使用Transformer模型进行HSI分类中,判别特征提取不足、捕获长范围依赖效率低以及在网络学习过程中层间信息交换损失的问题依然存在。

ViT是2020年Google团队提出的将Transformer应用在图像分类的模型,模型简单、效果好且可扩展性强,为视觉相关任务提供了新的见解、灵感和创造性空间,Dosovitskiy等[18]实验表明使用迁移学习的ViT与最先进的卷积网络相比能够取得优异的结果,且训练所需的计算资源大量减少。本文将Non-local模块和跨层自适应融合机制(cross-layer adaptive fusion,CAF)应用到ViT模型,并引入标签平滑缓解过拟合问题,采用patch-wise的输入方式,在很大程度上保留网络学习中的频谱顺序信息,同时考虑空间上下文信息。旨在在训练样本有限的情况下,建立一个基于ViT的端到端训练网络模型,在保证湿地数据集分类精度的基础上减少网络的复杂性。

1 本文方法

本文改进的基于ViT的HSI分类网络,充分利用Non-local的判别特征提取能力和CAF模块的层间信息交换效率,进一步提高了HSI分类的性能。其网络框架图如图1所示,图1(a)为本文改进模型的总体框架概述,图1(b)为Transformer编码器的具体流程。首先,在光谱特征提取器中加入中范围的残差连接机制来自适应学习跨层特征融合,增强层与层之间的连接,减少网络学习过程中的信息损失,其次,为了充分利用HSI丰富的光谱空间信息,在Transformer Encoder块之后插入非局部模块扩大感受野,帮助模型关注重要特征。为了防止训练过拟合问题,同时将标签平滑机制集成到ViT框架中,并以patch-wise为输入方式,提高细微光谱差异的细节捕获能力,提高层间的信息传递性,最后经过分类器得到分类结果。

图1

图1   本文改进算法模型图

Fig.1   This article improves the algorithm model diagram


1.1 Non-local模块

Non-local模块主要是针对感受野,一般的卷积的感受野大小都是3×3或5×5,而使用Non-local可以让感受野变得很大,而非局限于一个局部邻域,利用其对低级和高级特征图进行处理,提取出更多的判别特征,有效地去除异常值,其结构与实现细节如图2所示[19-21]。图中Θ,Φ,ɡh是通过1×1卷积实现的,H×W为空间样本大小,C为特征通道数。

图2

图2   Non-local模块和实现细节

Fig.2   Non-local module and implementation details


Non-local模块的注意力行为可以有效地表达目标信息,抑制不相关的信息,帮助模型关注重要特征,以适应复杂背景、小目标、目标重叠或稀疏地理对象分布不均匀等问题。定义公式为:

${{y}_{i}}=\frac{1}{C\left( x \right)}\underset{\forall j}{\mathop \sum }\,f\left( {{x}_{i}},{{x}_{j}} \right)g\left( {{x}_{j}} \right)$,

式中: x为输入特征图; i为输出位置,如时间、空间或者时空的索引,指对当前位置的响应; j为全局响应; f函数计算ij的相似度; g函数计算特征图在j位置上的表示; C(x)为响应因子。

Non-local通过计算任意2个位置之间的交互直接捕捉远程依赖,而不用局限于相邻点,其相当于构造了一个和特征图谱尺寸一样大的卷积核,从而可以维持更多信息。Non-local模块的非局部操作不管位置距离如何都可以模拟HSI的长距离依赖关系,即使是在有限层的浅层网络中。非局部操作将一个位置的响应作为输入特征映射中所有位置的特征的加权和,因此,每个位置的权重都被自动学习。

1.2 CAF模块

残差连接机制是在ResNet网络中提出的思想,它可以增强层间的信息交换,减少网络学习过程中的信息损失,已被证明是深度网络中的一种有效的策略[22-24]。例如,He等[25]探索了各种残差结构的效果,解决了深度CNN难以训练并且过深的层数导致性能退化的问题。由于Transformer中的残差连接只在单个块中使用,这样削弱了不同层之间的连接。短残差连接机制的信息“记忆”能力仍然有限,而长残差连接机制由于高水平和低水平特征之间的较大差距,往往会产生特征融合不足。为此,本文在光谱特征提取器中加入中范围的残差连接机制来自适应学习跨层特征融合,CAF模块的数量是提高本文网络分类性能的重要因素。模块介绍见图3,可以看到,CAF只跳过一个编码器,原因有2个,一方面,如果使用相对较长的残差连接甚至更多的编码器,会导致特征融合不足和潜在的信息丢失,另一方面对于训练样本较少的数据集,一个4层或5层的浅层网络已经适合HSI图像分类任务,因此,本文模型中设计CAF模块只跳过一个编码器。

图3

图3   CAF模块

Fig.3   Adaptive cross-layer residual connection module


1.3 标签平滑法

在实际应用中只有有限的训练样本是一个常见的问题,而这会导致模型面临“过拟合”的问题,测试数据的分类精度较低。为了解决本文模型中的过拟合问题,引入了标签平滑法。

在图像分类任务中,每个训练样本M都有相对应的标签n∈{1,2,…,K},K为类别的数量。使用一个K维独热(one-hot)向量N来表示训练样本M的标签:

Nq=δq,n

式中: q=1,2,…,K; δq,n为离散的狄拉克函数,q=n时取值为1,否则为0。

然而,Hinton等[26]的研究表明,如果我们将所有的地面真实标签指定为“硬标签”(即δq,n),该模型将推动标签的预测分布向硬标签发展,如果标签被适当地平滑,即在δq,n中的0上分配很小的概率,就可以有效地缓解过拟合问题。标签平滑处理会将原始标签Nq更改为N' q,定义如下:

N'q=(1-ε)δq,n+(1-δq,n)εK-1

式中: N'q混合了训练样本M的标签和K-1个错误类的固定均匀分布; ε是平滑因子。

通过简化模型来学习每个训练样本的全概率标签,标签平滑机制可以缓解过拟合问题,提高模型的泛化能力。

2 研究区概况与数据集

2.1 研究区概况

黄河三角洲湿地是渤海重要的生态功能区域,位于中国山东省东北部的渤海沿岸(N36°55'~38°16',E117°31'~119°18'),如图4所示,是中国最完整、最广泛、最全面的湿地生态系统,河流、芦苇、盐渍湿地等天然湿地约占68.4%,其余为池塘、水库等人工湿地。植被覆盖率高达53.7%,是我国沿海地区面积最大的海滩自然植被区域,鸟类资源丰富,珍稀濒危鸟类众多,在生物多样性保护和生态修复中起着重要的作用。

图4

图4   研究区域位置

Fig.4   Location of the study area


2.2 数据集描述

本文使用的数据是Xie等[27]建立的湿地土地覆盖类型数据库,即黄河三角洲HSI数据集,数据集由DJI M600无人机平台搭载的12 mm焦距Nano-hyperspec成像传感器采集,包含NC12,NC16和NC13 3个数据集,为了验证本文方法的有效性,选取NC16和NC13数据集进行试验。

2.2.1 NC16数据集

NC16数据集于2020年9月23日晴朗无云的天气情况下获取。采集时间为13: 50—14: 20,无人机的飞行高度是400 m,空间分辨率约0.266 m,图像尺寸为1 060像素×976像素,总共涵盖了270个波段。该数据集地物类型共有16类,包括水域、柽柳、旱田等。

2.2.2 NC13数据集

NC13数据集于2020年9月24日14: 47—15: 20时间段内采集,天气状况阴。无人机的飞行高度为300 m,空间分辨率约为0.182 m,数据集中的图像尺寸为1 098像素×808像素,共有270个波段,包含13种土地覆盖类型,大部分为混生地物。

3 实验结果与讨论

本章节介绍了实现细节和比较的先进方法,以定量和定性地评估所提出的模型在湿地HSI分类中的性能。

3.1 分类方法对比分析

在本节中,使用NC16和NC13数据集来验证所改进模型的有效性。所有实验均是在配有NVIDIA GeForce RTX 3060,128 GB RAM的Windows 10系统上运行的,深度学习采用Pytorch框架。对于每个数据集,选择少量的样本作为训练集,其余的作为测试集,其中NC16和NC13数据集训练样本数分别设为2.89%和1.66%,我们采用了Adam优化器,其批次大小为64。学习速率初始化为5E-4,并设置随着epochs的增大而逐渐减小学习率从而达到更好的训练效果。每个实验独立重复进行,调整超参数并选用最优参数。此外,最大训练epochs的数量被设置为400。

采用查全率评价各类别的精度,采用总体精度(overall accuracy,OA)、平均精度(average accuracy,AA)和Kappa系数来定量评价实验中不同分类方法的性能。查全率表示预测对的在实际样本中的比值; OA表示所有正确分类的样本在总标记样本中的比例; AA被定义为每个类别被正确分类的百分比的平均值; Kappa系数是一个用于一致性检验的指标。为了验证该方法在黄河三角洲湿地数据集上的优越性,选取几种经典的分类方法进行对比分析,对比方法包括SVM[28],1DCNN[29],CDCNN[30],SSRN[31],HybridSN[32]和ViT[33]

NC16数据集各方法分类精度和分类结果图分别如表1图5所示(表中同一类别精度最高的方法加粗表示)。

表1   NC16数据集的不同方法的分类结果

Tab.1  Classification results of different methods for NC16 datasets(%)

类别查全率
SVM1DCNNCDCNNSSRNHybridSNViT本文方法
碱蓬93.9199.7699.6399.6496.2398.7899.87
水泥路94.4688.0292.1987.6178.1064.3481.59
沥青柏油路93.1287.0987.0287.9774.3380.2891.56
水域89.9799.1091.6798.3896.4197.7599.99
石块71.4593.1995.1593.4076.0095.4878.23
草地80.5276.7473.3373.7191.5374.4774.44
铁杆00012.50031.2533.50
柽柳060.4685.9855.8149.8754.5682.29
枯萎的芦苇50.1657.4066.2453.0379.6670.2866.25
芦苇47.1552.7678.2373.1854.1863.6971.19
互花米草98.7294.1195.3686.5492.0095.7496.37
苔藓31.5067.8971.5076.4298.0273.7272.16
旱田84.9382.0088.6492.7496.5796.0794.94
湿地97.3691.9291.6894.6499.9394.1597.40
滩涂65.4182.1993.9168.2093.9188.0194.87
标准反射板0100.0057.6043.8031.0093.75100.00
OA85.7692.6392.7294.9994.1894.6296.24
AA62.4277.0479.2574.8575.4879.5283.42
Kappa80.8289.8690.0193.1292.1192.6294.80

新窗口打开| 下载CSV


图5

图5   NC16 数据集分类结果

Fig.5   NC16 dataset classification result plot


由分类结果可以看出,NC16数据集中铁杆、柽柳、标准反射板类别在不同网络模型中分类结果较差,SVM,1DCNN,CDCNN和 HybridSN方法不能识别铁杆类,不能很好地在分类图中对柽柳进行分类,因为它们的样本量相对较少,此外,随机抽样是基于百分比抽样,导致这些类别的训练数量少,样本不均衡。1DCNN获得了有噪声的分类图,原因是不能有效提取空间信息。通过引入注意力机制,SSRN和ViT方法比 SVM,1DCNN 和 CDCNN方法获得了更好的分类性能,OA值分别达到94.99%和94.62%。相比之下,由于本文方法充分利用了多头注意机制捕获长距离依赖、有效增强层间信息交换,所以在NC16数据集上可以在所有方法中获得更好的性能,分类结果稳定,杂碎斑点较少,相比于ViT,改进方法的OA,AA和Kappa分别提高了2.18,3.90和1.62百分点。

NC13数据集各方法分类精度和分类结果图分别如表2图6所示(表中同一类别精度最高的方法加粗表示)。

表2   NC13数据集的不同方法的分类结果

Tab.2  Classification results of different methods for NC13 datasets (%)

类别名称查全率
SVM1DCNNCDCNNSSRNHybridSNViT本文方法
碱蓬86.0880.3780.9791.1095.5388.3092.23
沥青水泥混合路面99.9699.7798.6499.37100.0094.0599.73
湿地77.1087.1786.6590.0470.7773.3880.37
水域99.9899.9798.8299.81100.0099.5499.76
石油90.3593.7891.0899.5495.2094.2499.04
芦苇31.8446.9653.9144.2752.8452.0050.89
柽柳038.9460.0050.5617.0446.3657.27
27.3665.4977.7487.7272.9357.3685.17
旱田53.6781.1387.6466.0698.2792.0074.97
标准反射板0100.0037.6597.37089.7951.02
柽柳芦苇混生35.1256.6353.4459.6059.1351.7352.13
碱蓬芦苇混生61.5664.7969.2346.5469.7351.9865.12
芦苇水域混合45.8249.5249.8865.7758.5468.7265.61
OA69.3870.4169.8171.4670.6570.8673.84
AA54.5374.1972.7476.7568.4673.8074.87
Kappa62.7364.9164.2966.1865.1965.4768.94

新窗口打开| 下载CSV


图6

图6   NC13 数据集分类结果

Fig.6   NC13 dataset classification result plot


在NC13数据集上存在许多混生地物,这使得分类任务非常困难。SVM,1DCNN 和 CDCNN在NC13数据集上表现欠佳,这是由于它们的特征提取器无法提取出复杂场景下的地物特征。HybridSN结合2DCNN和3DCNN提高分类结果,然而,在一些对象中也存在一些错误分类的像素,对柽柳和标准反射板的分类效果差,原因是训练样本少。基于注意力机制的方法,SSRN引入残差连接来提高分类性能,ViT和本文提出的方法获得了更好的分类精度,这也表明了注意机制确实有助于提高分类精度。在所有基于注意力的方法中,本文模型通过整合光谱和空间信息,提高层间信息传递性获得了最高的分类精度,OA,AA和Kappa分别达到了73.84%,74.87%和68.94%。

3.2 消融实验

为验证Non-local和自适应跨层连接模块在黄河三角洲湿地高光谱地物分类任务上的有效性,本文基于ViT模型进行了消融实验,消融实验结果如表3所示。具体来说,没有Non-local和CAF模块的ViT的分类精度最低,通过将Non-local或CAF插入ViT,均可得到精度更高的分类结果。更好的是,Non-local和CAF的联合开发可以进一步显著提高性能。这可以解释为,在添加CAF后,光谱信息能够更有效、更容易地学习,Non-local可以抑制不相关信息,提取更多的判别特征。结果表明,相较于基础模型,使用Non-local和CAF模块后的ViT模型高光谱地物分类的结果有显著提升。

表3   消融实验的结果

Tab.3  Results of ablation experiments(%)

Non-localCAFNC16NC13
OAAAKappaOAAAKappa
××94.6279.5292.6270.8673.8065.47
×95.4176.8293.6771.2674.4965.94
×95.6179.9793.9471.7374.7266.51
96.2483.4294.8073.8474.8768.94

新窗口打开| 下载CSV


4 结论

为充分挖掘高光谱图像中所包含的空间光谱信息,本文改进了一种可以提高黄河三角洲湿地HSI分类性能的ViT方法,该方法将Non-local模块与ViT结构有机地集成,采用跨层残差连接机制减少网络学习过程中的信息损失,有助于层间信息传递,最小限度地减少空间和光谱特征的损失,也避免了局部信息的丢失,这种操作使得对土地覆盖类型特征的分析更加充分,全面利用不同层之间的特征信息,更好地进行地物分类。

利用NC16和NC13数据集进行实验,并与SVM,1DCNN,CDCNN,SSRN,HybridSN和ViT等方法进行对比分析。实验表明,与其他分类方法相比,本文提出的方法能有效提高分类性能,在精度上达到了最高,证明了该方法的实用性。未来将基于ViT结构研究不同的湿地高光谱场景数据之间的泛化能力,从而进一步提高分类精度。

参考文献

Xia Y, Fang C, Lin H, et al.

Spatiotemporal evolution of wetland eco-hydrological connectivity in the Poyang Lake area based on long time-series remote sensing images

[J]. Remote Sensing, 2021, 13(23):4812.

[本文引用: 1]

López-Tapia S, Ruiz P, Smith M, et al.

Machine learning with high-resolution aerial imagery and data fusion to improve and automate the detection of wetlands

[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 105:102581.

[本文引用: 1]

Sun S, Wang Y, Song Z, et al.

Modelling aboveground biomass carbon stock of the Bohai rim coastal wetlands by integrating remote sensing,terrain,and climate data

[J]. Remote Sensing, 2021, 13(21):4321.

[本文引用: 1]

王欣, 樊彦国.

基于改进DenseNet和空谱注意力机制的高光谱图像分类

[J]. 激光与光电子学进展, 2022, 59(2):0210014.

[本文引用: 1]

Wang X, Fan Y G.

Hyperspectral image classification based on modified DenseNet and spatial spectrum attention mechanism

[J]. Laser & Optoelectronics Progress, 2022, 59(2):0210014.

[本文引用: 1]

郑宗生, 刘海霞, 王振华, .

改进3D-CNN的高光谱图像地物分类方法

[J]. 自然资源遥感, 2023, 35(2):105-111.doi:10.6046/zrzyyg.2022100.

[本文引用: 1]

Zheng Z S, Liu H X, Wang Z H, et al.

Improved 3D-CNN-based method for surface feature classification using hyperspectral images

[J]. Remote Sensing for Natural Resources, 2023, 35(2):105-111.doi:10.6046/zrzyyg.2022100.

[本文引用: 1]

Duan P, Kang X, Li S, et al.

Multichannel pulse-coupled neural network-based hyperspectral image visualization

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020, 58(4):2444-2456.

[本文引用: 1]

贾少鹏, 高红菊, 杭潇.

基于深度学习的农作物病虫害图像识别技术研究进展

[J]. 农业机械学报, 2019, 50(s1):313-317.

[本文引用: 1]

Jia S P, Gao H J, Hang X.

Research progress on image recognition technology of crop pests and diseases based on deep learning

[J]. Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(s1):313-317.

[本文引用: 1]

Chen Y, Lin Z, Zhao X, et al.

Deep learning-based classification of hyperspectral data

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(6):2094-2107.

[本文引用: 1]

Mou L, Ghamisi P, Zhu X X.

Deep recurrent neural networks for hyperspectral image classification

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(7):3639-3655.

[本文引用: 1]

Paoletti M E, Haut J M, Fernandez-Beltran R, et al.

Capsule networks for hyperspectral image classification

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(4):2145-2160.

[本文引用: 1]

Zhu L, Chen Y, Ghamisi P, et al.

Generative adversarial networks for hyperspectral image classification

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(9):5046-5063.

[本文引用: 1]

陈禹汗, 王波, 严清赟, .

结合Transformer与多尺度残差机制的高光谱遥感分类

[J]. 激光与光电子学进展, 2023, 60(12):3788/LOP220921.

[本文引用: 1]

Chen Y H, Wang B, Yan Q Y, et al.

Hyperspectral remote-sensing classification combining transformer and multiscale residual mechanisms

[J]. Laser & Optoelectronics Progress, 2023, 60(12):3788/LOP220921.

[本文引用: 1]

Sun L, Zhao G, Zheng Y, et al.

Spectral-spatial feature tokenization transformer for hyperspectral image classification

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60:5522214.

[本文引用: 1]

Hong D, Han Z, Yao J, et al.

SpectralFormer:Rethinking hyperspectral image classification with transformers

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60:5518615.

[本文引用: 1]

Zhong Z, Li Y, Ma L, et al.

Spectral-spatial transformer network for hyperspectral image classification:A factorized architecture search framework

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60:5514715.

[本文引用: 1]

Liu K, Sun W, Shao Y, et al.

Mapping coastal wetlands using transformer in transformer deep network on China ZY1-02D hyperspectral satellite images

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2022, 15:3891-3903.

[本文引用: 1]

Gao Y, Song X, Li W, et al.

Fusion classification of HSI and MSI using a spatial-spectral vision transformer for wetland biodiversity estimation

[J]. Remote Sensing, 2022, 14(4):850.

[本文引用: 1]

Dosovitskiy A, Beyer L, Kolesnikov A, et al.

An image is worth 16x16 words:Transformers for image recognition at scale

[J/OL]. 2020.arXiv,2010.11929[2023-6-17]. https://arxiv.org/abs/2010.11929v1.

URL     [本文引用: 1]

Wang C, Bai X, Zhou L, et al.

Hyperspectral image classification based on non-local neural networks

[C]// IGARSS 2019-2019 IEEE International Geoscience and Remote Sensing Symposium.Yokohama,Japan.IEEE, 2019: 584-587.

[本文引用: 1]

Ma H, Liu G, Yuan Y.

Enhanced non-local cascading network with attention mechanism for hyperspectral image denoising

[C]// 2020 IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP).Barcelona,Spain.IEEE, 2020:2448-2452.

[本文引用: 1]

Lei R, Zhang C, Du S, et al.

A non-local capsule neural network for hyperspectral remote sensing image classification

[J]. Remote Sensing Letters, 2021, 12(1):40-49.

[本文引用: 1]

He K, Zhang X, Ren S, et al.

Identity mappings in deep residual networks

[C]// European Conference on Computer Vision.Cham:Springer, 2016:630-645.

[本文引用: 1]

Huang G, Liu Z, Van Der Maaten L, et al.

Densely connected convolutional networks

[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Honolulu,HI,USA.IEEE, 2017:2261-2269.

[本文引用: 1]

Ronneberger O, Fischer P, Brox T.

U-net:Convolutional networks for biomedical image segmentation

[C]// International Conference on Medical Image Computing and Computer-Assisted Intervention.Cham:Springer, 2015:234-241.

[本文引用: 1]

He K, Zhang X, Ren S, et al.

Deep residual learning for image recognition

[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).June 27-30,2016.Las Vegas,NV,USA.IEEE, 2016:770-778.

[本文引用: 1]

Hinton G E, Vinyals O, Dean J.

Distilling the knowledge in a neural network

[J]. Computer Science, 2015, 14(7):38-39.

[本文引用: 1]

Xie Z, Hu J, Kang X, et al.

Multilayer global spectral-spatial attention network for wetland hyperspectral image classification

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60:5518913.

[本文引用: 1]

Melgani F, Bruzzone L.

Classification of hyperspectral remote sensing images with support vector machines

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2004, 42(8):1778-1790.

[本文引用: 1]

Hu W, Huang Y, Wei L, et al.

Deep convolutional neural networks for hyperspectral image classification

[J]. Journal of Sensors, 2015, 2015:258619.

[本文引用: 1]

Lee H, Kwon H.

Going deeper with contextual CNN for hyperspectral image classification

[J]. IEEE Transactions on Image Processing:a Publication of the IEEE Signal Processing Society, 2017, 26(10):4843-4855.

[本文引用: 1]

Zhong Z, Li J, Luo Z, et al.

Spectral-spatial residual network for hyperspectral image classification:A 3-D deep learning framework

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(2):847-858.

[本文引用: 1]

Roy S K, Krishna G, Dubey S R, et al.

HybridSN:Exploring 3-D-2-D CNN feature hierarchy for hyperspectral image classification

[J]. IEEE Geoscience and Remote Sensing Letters, 2020, 17(2):277-281.

[本文引用: 1]

Vaswani A, Shazeer N, Parmar N, et al.

Attention is all you need

[J]. Advances in Neural Information Processing Systems, 2017,30.

[本文引用: 1]

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发