自然资源遥感, 2024, 36(2): 10-20 doi: 10.6046/zrzyyg.2023027

综述

多标签遥感图像分类研究现状与展望

林聃,1, 李秋岑1, 陈志奎,1,2, 钟芳明1,2, 李丽方1

1.大连理工大学软件学院,大连 116620

2.大连理工大学辽宁省泛在网络与服务软件重点实验室,大连 116620

Research advances and challenges in multi-label classification of remote sensing images

LIN Dan,1, LI Qiucen1, CHEN Zhikui,1,2, ZHONG Fangming1,2, LI Lifang1

1. School of Software Technology, Dalian University of Technology, Dalian 116620, China

2. Key Laboratory for Ubiquitous Network and Service Software of Liaoning Province, Dalian University of Technology, Dalian 116620, China

通讯作者: 陈志奎(1968-),男,博士,教授,主要从事大数据计算及其在土壤、海洋资源遥感的应用研究。Email:zkchen@dlut.edu.cn

责任编辑: 张仙

收稿日期: 2023-02-13   修回日期: 2023-04-3  

基金资助: 国家自然科学基金项目“面向土地利用现状判读的小样本跨模态学习模型”(62076047)

Received: 2023-02-13   Revised: 2023-04-3  

作者简介 About authors

林 聃(1992-),女,博士,博士后,主要从事计算机视觉与遥感图像学习研究。Email: dan.lin@ntu.edu.sg

摘要

多标签遥感图像分类是遥感分析领域的基础研究任务之一,解析给定的遥感图像并识别其中的类别语义,可以为下游计算机视觉任务提供重要的技术基础; 由于遥感图像空间分辨率不断提升,众多遥感对象以不同规模、颜色、形状分布于图像的各个区域,为遥感图像多标签分类任务带来了严峻挑战。该文聚焦于遥感领域的多标签图像分类研究,对该问题的前沿研究进展进行总结分析。首先,阐述多标签遥感图像分类任务的问题定义,并对该研究问题中常用的多标签图像数据集和模型评估指标进行归纳介绍; 进而,对该领域的前沿进展进行系统性的介绍,深入剖析多标签遥感图像分类过程中的2个关键任务——遥感图像特征提取和标签特征提取; 最后,针对遥感图像特性,分析了该任务当前存在的挑战和问题,并对未来研究方向进行展望。

关键词: 遥感图像; 多标签遥感图像分类; 多标签分类; 遥感

Abstract

Multi-label classification of remote sensing images plays a fundamental role in remote sensing analysis. Parsing given remote sensing images to identify semantic labels can provide a significant technical basis for downstream computer vision tasks. With the continuously improved spatial resolution of remote sensing images, many remote sensing objects with different scales, colors, and shapes are distributed in various zones of images, posing high challenges to the multi-label classification task of remote sensing images. This study focuses on the multi-label classification of images in the field of remote sensing, summarizing and analyzing the frontier research advances in this regard. First of all, this study expounded the problem definition for the multi-label classification task of remote sensing images while generalizing the commonly used multi-label image datasets and model evaluation indicators. Furthermore, by systematically presenting the frontier progress in this field, this study delved into two key tasks in the multi-label classification of remote sensing images: feature extraction of remote sensing images and label feature extraction. Finally, based on the characteristics of remote sensing images, this study analyzed the current challenges of multi-label classification as well as subsequent research orientation.

Keywords: remote sensing image; multi-label classification of remote sensing images; multi-label classification; remote sensing

PDF (5870KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

林聃, 李秋岑, 陈志奎, 钟芳明, 李丽方. 多标签遥感图像分类研究现状与展望[J]. 自然资源遥感, 2024, 36(2): 10-20 doi:10.6046/zrzyyg.2023027

LIN Dan, LI Qiucen, CHEN Zhikui, ZHONG Fangming, LI Lifang. Research advances and challenges in multi-label classification of remote sensing images[J]. Remote Sensing for Land & Resources, 2024, 36(2): 10-20 doi:10.6046/zrzyyg.2023027

0 引言

遥感技术诞生于20世纪60年代初,作为一种新兴技术,为地球表面地理特征探测提供了一种远距离、非接触式的手段,因而一直备受研究者和工业界的关注。遥感技术已广泛应用于农林规划、水文探测、环境保护、城市建设等领域,结合场景分类[1]、目标检测[2]、图像分割[3]等计算机方法,形成了一个地面-空中-空间全方位、数据收集-处理-分析-应用一体化的综合体系。近年来,随着遥感卫星数量和成像技术的不断发展,遥感图像数据以每天TB级数量快速增长[4],同时在空间、时间、光谱等维度的分辨率也不断提高。为了充分理解遥感图像包含的丰富对象信息,遥感图像分类任务被提出并吸引了研究者的广泛关注。

遥感图像分类旨在识别遥感图像中每个像元或比较匀质的像元组所蕴含的语义标签(对象)。早期的遥感图像分类关注遥感图像中占据主体像元组的单一地物,为其赋予单一标签,即单标签遥感图像分类。大量学者已经对这类方法进行了深入研究[5-6],并将其广泛应用到实际遥感任务中,如植被覆盖测绘[7]、智慧城市规划[8]和地表环境监测[9]等。单标签遥感图像分类从宏观上解读了遥感图像的核心语义内容。然而,遥感成像具有大视场的特性,高分辨率遥感图像涵盖了对多类型地表地物信息的客观表达。面向该复杂场景的遥感图像细粒度分析,单标签分类方法已难以满足业界需求。例如,一幅遥感图像同时包含树木、水域、建筑、公路、草地等多个物体,且这些物体以不同尺度、角度分布在图像的各个位置。面对这种情况,传统的单标签遥感图像分类方法难以为拥有多个不同语义标签的遥感图像提供有效标签预测。由此,多标签遥感图像分类研究应运而生。

多标签遥感图像分类旨在为给定遥感图像提供细粒度的图像感知,即为单张遥感图像同时预测多个可能的标签[10]。该任务能够细粒度解读遥感图像蕴含的丰富语义内容,为下游应用提供了基础性图像信息。然而,多标签遥感图像中,多个物体以复杂多变的尺度、形状分布于邻近空间中,具有尺度差异较大的特性。与此同时,由于地物多样性特点,遥感图像具有类内差异较大、类间相似度高的特性。这些特性为多标签遥感图像分类带来挑战。此外,遥感数据标注成本较高也是领域存在的挑战之一。面向这些挑战,多标签遥感图像分类任务愈发受到学术界和工业界的普遍关注,大量多标签遥感图像分类算法和模型被设计和提出,促进了该领域的快速发展和应用。

针对这一趋势,有必要及时总结该任务的研究现状,包括最新的技术和进展、当前面临的挑战和发展前景,以便更好地指导未来的学术研究和实际应用。然而,目前对多标签遥感图像分类的综述研究尚处于初始阶段。目前国内外学者主要针对单标签的遥感图像分类进行总结和介绍,尚未有学者对多标签分类任务展开系统的梳理和总结。由此,本文总结了多标签遥感图像分类的研究进展、挑战和展望,旨在为该领域的发展和应用提供参考。

本文聚焦于遥感领域的多标签图像分类研究,对该问题的前沿研究进展进行总结分析。首先给出多标签遥感图像分类的形式化定义,并介绍常用的数据集与评价指标; 在此基础上详细介绍多标签遥感图像分类任务的前沿进展; 然后深入剖析多标签遥感图像分类过程中的2个关键任务——遥感图像特征提取和标签特征提取; 根据遥感图像特性,分析了该任务当前存在的挑战和问题,并对未来研究方向进行展望。

1 多标签遥感图像分类基础介绍

本章首先介绍多标签遥感图像分类任务的问题定义; 进而对领域内常用的6个数据集展开了详细介绍; 最后,总结了该任务的评估指标及其计算方法。

1.1 问题定义

多标签遥感图像分类为给定的单张遥感图像同时预测多个可能的标签。相比于单标签分类,多标签图像分类更具挑战性。图1中列举了单标签和多标签遥感图像的示例,直观来讲,单标签遥感图像的目标大多位于核心区域,而多标签遥感图像包含物体内容种类多样且形状多变,难以区分。

图1

图1   单标签与多标签分类任务遥感图像样本对比

Fig.1   Comparison of single-label and multi-label remote sensing image


对于给定遥感图像数据集D=(X,L),其中X={x1,x2,,xn}为包含n个图像的样本空间; L={l1,l2,,lc}c个标签的集合。每个样本xiX的真实标注为二元向量yi={yi1,yi2,,yic},如果样本xi中标签lk为真,则yik=1; 否则yik=0。由此,多标签遥感图像分类问题旨在构建一个函数f,自变量是给定的遥感图像xi,输出是预测的标签向量yi,f:xiyi

1.2 常用的数据集

随着遥感图像分析任务的不断发展,越来越多的多标签遥感图像数据集被构建和研究。本文将重点介绍6个具有代表性的多标签遥感图像数据集: 该任务最早提出并使用的UCM数据集、单标签数据重建得到的DFC15数据集,以及最近构建的AID,MultiScene,MLRSNet和BigEarthNet数据集。以下给出其详解介绍,表1列出了各个数据集的数值统计情况。

表1   多标签遥感图像数据集数值统计

Tab.1  Numbers of images and classes in multi-label remote sensing image datasets(张)

数据集图像总数类别数训练数测试数
UCM2 100171 680420
AID3 000172 400600
DFC153 34282 674668
MultiScene100 0003693 0007000
MLRSNet109 1614654 58154 580
BigEarthNet590 32619415 471103 868

新窗口打开| 下载CSV


1.2.1 UCM多标签遥感图像数据集

UCM数据集[11]是多标签遥感图像分类中最常见、最经典的数据集之一。该数据集从单标签UC Merced土地利用数据集重建, UCM多标签数据集基于人工检查使用多个标签进行注释, 共有2 100个样本, 每个样本大小为256像素×256像素, 空间分辨率约为0.3 m。数据集共包含17个标签, 包括airplane, sand, pavement, buildings, cars, chaparral, court, trees, dock, tank, water, grass, mobile-home, ship, bare-soil, sea和field。

1.2.2 DFC15多标签遥感图像数据集

DFC15数据集[9]是新提出的多标签遥感图像数据集, 它是从单标签数据集(在2015年IEEE GRSS数据融合竞赛中发布)重建的。与UCM数据集相比, DFC15数据集更具挑战性, 因为该数据集中的遥感图像具有极高的光谱分辨率和较低的裁剪后图像间相似性。标签集中共有8类标签, 包括impervious, water, clutter, vegetation, building, tree, ship和cars。数据集体量为3 342幅遥感图像。

1.2.3 AID多标签遥感图像数据集

AID多标签数据集[12]从公共AID数据集扩展而来,包括3 000张带有手动注释多个标签的航空图像。AID多标签数据集中图像大小为600像素×600像素,空间分辨率从0.5~8 m不等。因此,AID数据集中图像包含更加丰富的遥感物体。该数据集的标签空间包含17个对象,与UCM数据集相同。

1.2.4 MultiScene多标签遥感图像数据集

MultiScene数据集[13]于2019年正式发布,收集来自谷歌地球影像的高空间分辨率遥感图像,其区域涵盖六大洲的11个国家。MultiScene中包含10万个样本,每幅图像的大小为512像素×512像素,空间分辨率范围为 0.3~0.6 m。该数据集中,总共定义了36个类别,包括apron, baseball field,beach,bridge和cemetery等。与前期数据集相比,该数据集在数量上取得了突破性进展。

1.2.5 MLRSNet多标签遥感图像数据集

MLRSNet多标签遥感图像数据集[14]于2020年发布。该数据集包含109 161个高分辨率遥感图像样本,样本大小为256像素×256像素,空间分辨率范围为0.1~10 m。数据集涵盖了46种标签类别,如airplane和airport等。与前期数据集相比,该数据集样本量进一步扩大,包含的类别信息更加丰富。

1.2.6 BigEarthNet多标签遥感图像数据集

BigEarthNet多标签遥感图像数据集[15]是遥感图像学习领域首个大规模数据集。数据集的空间分辨率包含10 m,20 m和60 m 3种,其对应的图像大小分别为120像素×120像素、60像素×60像素、20像素×20像素。标签集中共有19类标签,包括urban fabric和pastures等。随着该数据集不断扩充和丰富,前后共发布了BigEarthNet-S2[15]和BigEarthNet-MM2个版本[16]。早期BigEarthNet-S2版本包括15 894张Sentinel-2多光谱图像; 随后发布的BigEarthNet-MM数据集包含590 326个Sentinel-1和Sentinel-2图像对,形成多模态多标签大规模遥感图像数据集。

随着遥感图像采集技术的不断进步,遥感图像多标签数据集规模不断扩大,类别信息也逐渐丰富。这为新兴的深度学习模型的参数学习和训练提供了数据支撑。

1.3 评估指标

分类任务中常用3种评估指标对模型的性能进行评价: 准确率(P)、召回率(R)和F-得分(包括F1和F2)。在多标签分类任务中,可以从基于样本和基于标签2个角度计算上述3种指标。基于样本平均的评估指标(EP,ER,EF1,EF2)和基于标签平均的(LP,LR,LF1,LF2)评估指标计算方式为:

EP=i=1cNicori=1cNipre
LP=1ci=1cNicorNipre
ER=i=1cNicori=1cNigt
LR=1ci=1cNicorNigt
EFn=(1+n2)·EP·ERn2EP+ER
LFn=(1+n2)·LP·LRn2LP+LR

式中: c为标签个数; 对于第i个标签, Nicor为正确预测为正的样本数; Nipre为预测为正的样本数; Nigt为实际为正的样本数。

2 多标签遥感图像分类综合进展

近年来,多标签遥感图像分类备受关注,已成为遥感领域的热门课题,它为后续遥感计算机视觉任务提供了最基础的图像语义理解。在过去的几年里,随着城市管理、城市测绘和灾害监测等实际任务应用的发展,包含多目标的高分辨率卫星遥感图像不断积累,促使多标签遥感图像分类得到学术界和工业界的广泛关注。本章首先介绍了遥感图像分类任务的总体发展历程,而后给出多标签遥感图像分类任务的前沿进展介绍。

2.1 遥感图像分类

随着遥感图像空间分辨率的不断提高,遥感图像分类领域逐渐形成了3个不同层次的并行分支任务: 像素级、对象级和场景级分类[17]图2中的示例展示了3种不同分类方式的具体结果。像素级遥感图像分类主要针对早期低分辨率遥感图像,旨在为每一个像素点赋予语义意义,如图2(a)(d)所示。然而随着遥感图像空间分辨率不断提升,每个图像细节信息变得庞大而复杂。由此,Blaschke等[18]提出从对象层面理解遥感图像,旨在界定遥感图像中的不同对象,如图2(b)(e)。其中“对象”是指有意义的语义实体或单元,如一辆汽车、一座建筑物等。随后的研究中,一系列在对象级分析遥感图像的方法主导了遥感图像分析领域,为遥感图像带来了对象级解读[19]

图2

图2   3种遥感图像分类示例

Fig.2   Three kinds of remote sensing image classification


像素级和对象级遥感图像分类算法已经在一些土地利用识别中取得了显著的成就[20],但这2种方法需要依赖大量像素级和边框级(bounding box)的标注数据进行特征学习。由于遥感图像的分辨率不断提高,这2种级别的数据标注依赖背景知识,因此需要花费昂贵的成本。同时,在实际任务中,了解遥感图像的全局内容具有相当大的意义。由此,遥感图像场景级分析方法应运而生[21]。该类方法仅需要图像级的标注,旨在为给定遥感图像赋予整体的语义标签,如图2(c)(f)。传统的单标签遥感图像分类任务旨在将每个给定的遥感图像分类为一个语义标签。近年来,基于多标签的遥感图像分类能够对遥感图像进行细粒度的感知,该类方法将给定的遥感图像映射到多个语义类别,从而可以更好地帮助人们解读遥感图像中包含的丰富信息,因此受到研究者和工业界的广泛关注和应用。Zeggada等[22]将多标签图像分类用于解决实际任务中的无人驾驶飞行器(unmanned aerial vehicle,UAV)图像的分类中; Shendryk等[23]设计多标签分类方法以学习实际任务中的Sentinel-2图像的语义特征; Karalas等[24]介绍了多标签在遥感图像土地覆盖分类中的应用,通过整合不同空间分辨率的遥感数据给出图像的多标签预测结果。

2.2 多标签遥感图像分类方法

多标签遥感图像分类是遥感图像视觉领域的基础,为后续目标检测、语义分割等任务提供图像的基本语义解读。许多研究者从不同动机出发,提出了一系列的方法,以实现更高的标签预测精度。

从解决问题的策略来讲,现有多标签遥感图像分类可以分为2种类型: 问题转换(problem transformation,PT)以及算法适应(algorithm adaptation,AA)。PT策略旨在将多标签图像分类问题转换为现有的已经成熟的分类任务,如二元分类器[25]、分类器链[26]等。而AA策略更多地关注于利用现有的技术、方法直接处理多标签图像,例如决策树方法[27]、堆叠稀疏自动编码器[28]和神经网络模型[29]等。

早期的多标签遥感图像分类方法仍以传统单标签方式实现,该类方法将多标签图像分类映射为多个二元单标签图像分类,通过判定每个标签的出现与否得到最终的分类结果。但是这种分类方法计算成本较高。进而,学者们提出了一系列同时预测多个标签的模型,代表性模型包括条件随机场模型[30]、堆叠自动编码器方法[31]和基于支持向量机(support vector machine,SVM)的模型[32]

近年来,随着深度学习和神经网络的快速发展,现代多标签遥感图像分类方法取得了显著的性能提升[33]。各种源于深度神经网络(deep neural network,DNN)的模型结构被用于多标签遥感图像分类任务中,以帮助提高分类性能。Hua等[34]提出基于循环神经网络(recurrent neural network,RNN)的架构以序列化的方式预测多个标签; Wang等[35]提出K-medoids方法将图像分割成实例包。在标签预测阶段,Zhang等[36]关注遥感图像之间的全局关系,而Khan等[37]则关注空间区域之间的局部关系,此外,Hua等[38]提出了一种由特征提取模块、类注意力学习层组成的端到端神经网络模型,用于高分辨率遥感图像的多标签分类。为充分利用多标签训练样本,Hao等[39]提出了一种基于超像素分割和递归滤波的方法,具体包括基于递归过滤的特征提取、基于超像素的分割和基于光谱-空间相似性的错误标记样本去除的主要步骤。

3 多标签遥感图像分类关键任务

3.1 遥感图像特征提取

在绝大多数计算机视觉任务中,获取有效的视觉特征表示是整个任务的基石。因此,在遥感领域的多标签分类中,图像特征学习一直备受学者关注,随着机器学习技术的不断进步,遥感图像特征提取方法不断推陈出新。

早期的遥感图像主要依赖手工方法进行特征提取,例如,尺度不变特征变换(scale invariant feature transform,SIFT)、纹理描述、颜色直方图、局部二值模式(local binary pattern,LBP)等。这些依赖手工提取的分类方法可以在一定程度上获取图像的浅层特征并用于遥感图像的标签预测中。然而,这些方法在实际应用中存在局限性高、鲁棒性差、适应性弱等问题,同时易受到随机因素的干扰。Yang等[40]通过视觉词袋方法研究了高分辨率俯视图像的土地利用分类问题; Song等[41]使用SIFT方法将图像数据转换为坐标值,且该坐标保持对应于局部图像特征的尺度不变,这些坐标覆盖了图像在整个尺度和位置范围内的特征,进而根据特征向量的欧几里德距离寻找候选匹配特征; 姜亚楠等[42]基于多尺度LBP特征获取灰度属性信息并进行编码融合,学习本征属性信息和图像的多尺度局部结构特性。

随着大数据技术的发展、深度学习理论的进步以及并行计算资源的普及,基于深度学习的算法在遥感图像分类任务中表现出极强的特征感知能力,因而备受学术界的关注和工业界的青睐。早期的深度学习模型被广泛应用于遥感图像特征提取,例如堆叠自动编码器(stacked autoencoders)[43]、深度信念网络(deep belief net,DBN)[44]和自动编码器网络(autoencoder networks)[45]等。Wang等[31]使用堆叠自动编码器为遥感图像的每个像素提取深度特征,进而使用无监督方式表示混合像素在高维特征空间中的非线性特征; Fang等[46]引入谱聚类算法,专注于正负遥感图像实例之间的局部结构以获取标签特定的有效特征表示; Zhang等[47]使用排序方法来学习基于加权最近邻算法的软分类模型的邻居标签。这些简单深度学习模型的特征描述能力得到了证明,提升了多标签遥感图像分类的性能。

随着卷积神经网络(convolutional neural network,CNN)模型的不断成熟和广泛应用,基于CNN的特征抽取器在高分辨率遥感图像分类任务中逐渐成为主流技术方案。这些CNN模型通常在大型数据集上进行预训练,能够以端到端的方式直接应用于多标签遥感图像分类任务中。基于CNN模型的多标签遥感图像分类方法通常首先使用CNN模块提取遥感图像特征,然后输入到基于不同框架的标签预测器,例如RNN框架[48]、成对排名框架[49]和主动学习框架[50]等。许多学者针对如何设计有效的CNN网络模型进行了大量研究。Li等[51]基于CNN模型提取的图像特征为每个场景构建一个场景图,其中图的节点由场景的超像素区域表示,进而为了充分挖掘场景图的空间拓扑关系,提出了多层集成图注意力网络来建模这种拓扑关系; Aksoy等[52]利用基于2个协作网络的聚合估计标签不确定性,进而设计差异模块确保2个网络学习不同的特征,同时获得相同的预测; El-Khamy等[53]通过研究离散小波变换池对该模型性能的影响,提出了一种新的CNN模型,通过小波变换池化机制减少有效特征的丢失。

还有部分学者引入注意力机制来获取目标区域的特定特征。Ji等[54]引入了注意力模块,对CNN中提取的特征进行离散化,然后将离散化的特征发送到长短期记忆(long short-term memory,LSTM)网络中按照顺序预测标签; Sumbul等[55]采用K个分支CNN网络来描述图像局部区域的复杂空间和光谱内容,进而利用双向长短期记忆(Bi-LSTM)网络的新型多注意策略表征每幅图像不同局部区域的重要性得分,从而对遥感图像进行多标签分类; Yang等[56]设计了基于SE-ResNet网络的双分支通道注意力结构,从遥感图像中提取更丰富的图像特征; Diao等[57]使用可变形卷积网络学习具有几何变换不变性和自适应感受野的图像特征,然后采用注意力机制提取与标签相关的图像特征。

此外,多实例多标签(multi-instance multi-label,MIML)学习框架[58]也广泛应用于多标签遥感特征提取任务中。该框架将每个图像划分为多个实例(区域)对应于多个对象(标签)。MIML框架对于卫星图像等复杂对象比传统的学习框架更有效,已经成为多标签遥感图像分类的重要分支。现有的MIML算法如MIMLboost[58],MIMLsvm[59]和MIMLfast[60]已被发现在场景分类中具有实际意义,并且可以为复杂对象中的每个实例提供多个对象特征。

与此同时,为了解决基于CNN的模型在训练期间需要大量带注释的图像来优化所有参数的问题,部分学者研究针对噪声和不完整标注遥感图像的多标签分类方法。基于联合学习的多标签遥感图像分类框架通过差异模块和组lasso模块分别学习遥感图像的特征和潜在噪声标签,从而提升模型的鲁棒性[61-62]; Burgert等[63]通过研究标注缺失和冗余对模型鲁棒性的影响,从而设计针对已标注类和标注缺失类标签的同概率噪声嵌入策略,以提高分类准确性。综上所述,针对遥感图像的特征提取,最先由手工方法提取图像的纹理、颜色等浅层特征; 进而基于早期深度学习的简单方法能够对遥感图像的特征进行感知抽取; 随后,预训练的CNN模型能够通过端到端的方式抽取图像的特征向量表示。此外,注意力机制、MIML框架等可以提取标签对应的图像特征。

3.2 遥感标签特征学习

标签特征学习是多标签遥感图像分类任务中的重要研究内容。由于早期遥感图像分类集中于单一标签(目标),忽视了遥感图像中多目标共现的特性,导致单标签遥感图像分类难以深度解读遥感图像的细粒度内容。而在新兴的多标签遥感图像分类任务中,只有少数研究将标签相关性整合到标签预测过程中。一些方法通过考虑标签之间的依赖关系对标签进行特征学习。Koda等[32]利用带有空间嵌入的结构化SVM来表示标签之间的依赖关系; Zhang等[36]构建了一个加权概念图来利用共同标记的图像; Hua等[34]构建了一个基于LSTM的双向子网络,通过顺序预测多个标签来学习标签依赖性。

此外,部分方法通过统计标签在数据集内部的共现次数进而计算标签共现的条件概率来定义标签相关性。概率图模型在早期研究中被广泛用于计算标签的共存性。Li等[64]设计Conditional Graphical Lasso(CGL)采样方式在统一的贝叶斯网络内构建了条件标签结构学习方法框架; Hua等[65]使用先验知识对标签相关性进行编码,并使用标签相关性对嘈杂的网络预测进行规范化; Chen等[66]构建三级的树形结构表示船只标签之间的关联,并通过交叉熵损失对层次结构中的叶节点进行softmax归一化以区分细粒度类。

借助RNN的推理能力,多标签分类器模型只需图像级监督信息即可提取语义和空间标签关系[38,67]。Zhang等[67]通过设计基础的RNN模型,来学习区域化的语义依赖关系; Hua等[38]提出了一种创新的推理网络,它利用成对的标签关系来推断高分辨率航空图像的多个对象标签。此外针对标签依赖,许多学者还提出了基于注意力机制的方法[12,68]。Zhu等[68]通过空间正则化网络为所有标签生成注意力热度图,并通过可学习的卷积网络获取不同标签的潜在空间和语义关系。最近,新提出的为非网格结构化数据结构设计的图卷积神经网络(graph convolutional network,GCN)框架被逐步引入多标签图像分类任务中[69-70]。与传统的基于CNN的模型不同,GCN可以直接学习图数据结构,因此具有很强的关系推断能力。

随着图学习的兴起和图神经网络的提出,一些模型将标签相关性建模为图结构并通过GCN进行拓扑特征提取[70]。为了同时挖掘对象视觉信息和多个对象之间的空间关系,Li等[71]提出了一种结合CNN和GCN的新框架来解决多标签遥感图像场景分类问题; 杨敏航等[72]利用GCN模型抽取标签相关性特征,进而通过图像特征差异化函数指导提取图像特征; Lin等[73-74]构建概念图谱表示标签相关性并设计图神经网络学习概念图谱的特征。

综上所述,标签特征学习最初并未引起学者关注,许多方法忽略标签相关性信息; 进而,部分学者通过结构化标签之间的依赖关系展开早期的标签特征学习; 随后,部分方法通过计算数据集内标签共现的条件概率来定义标签相关性; 此外,部分学者通过RNN模型序列化标签依赖关系; 基于注意力机制的方法可以为标签相关性赋予权重; 最新的进展通过GCN直接学习图结构的标签关系。

基于上述阐述,为了更加直观地表达多标签遥感图像分类的研究进展,图3以树形结构对该任务的发展进行了可视化展示。自底向上由宏观到具体,分别详细展示了多标签遥感图像分类整体进展和2个关键任务,以及面临的关键挑战。具体来讲,图3中,下方树干部分从宏观角度描述了多标签分类任务中的2种解决策略,即AA和PT策略。同时,在2种策略的分支中分别总结了前文提到的代表性方法。进而,图3中部2个分支展示了该任务中的2个关键任务,即遥感图像标签特征提取和标签特征学习。最后,图3上部的树尖部分总结了针对该任务面临的关键挑战和未来发展趋势,这一部分将在接下来的第四章和第五章进行详细阐述。

图3

图3   多标签遥感图像分类研究进展结构

Fig.3   Research development of multi-label remote sensing image classification problem


4 多标签遥感图像分类的挑战

基于上述分析,本文总结了遥感图像多标签分类仍面临的一系列挑战,包括标签相关性有限问题、遥感图像尺度差异问题、类内差异较大问题、类间相似度高问题、遥感数据标注成本较高,并基于这些挑战对该领域进行了展望。

4.1 标签相关性有限问题

标签相关性被认为是多标签预测过程中的重要补充信息,其揭示了同一图像中不同对象的共存关联。一方面,由于地物分布复杂多样,在一张遥感图像中出现多个目标的现象十分普遍。如果一幅图像中有标签river,那么标签trees也出现在该图像中的概率会相对较大。如何有效获取标签共现信息以辅助多元标签的预测仍是当前多标签遥感图像分类任务的重要挑战之一。然而,目前已有的多标签遥感图像分类方法大多忽略标签相关性的学习,导致模型在多标签分类过程中性能受限。尽管部分方法构建了标签相关性信息,但这些相关性信息依赖数据统计,无法获得标签之间的语义关联。

另一方面,与自然图像数据集相比,目前大多数多标签遥感图像数据集由于规模较小,包含标签数量往往较少。例如,百万实例的MultiScene数据集的标签仅有36个,新提出的BigEarthNet多标签遥感图像数据集仅包含19个标签,而自然图像多标签场景级分类的MS COCO数据集包含80个标签,relabeling ImageNet数据集包含上万个类别。因此,这些数量较少的遥感标签之间的共现程度相似且有限,难以区分。未来研究中,探索有效、全面的标签相关性信息仍是该领域的关键任务。

4.2 遥感图像尺度差异问题

遥感图像尺度差异较大也是多标签遥感图像分类不可忽视的挑战。不同图像采集设备的成像技术不同,导致遥感图像在空间分辨率、图像尺度上存在一定差异性。在遥感成像中,传感器在不同高度的轨道上,从几百至几千km的高空对地面进行远程探测。随着成像距离变化,相同物体在不同场景中的规模差异较大。例如,飞机、河流等在不同的遥感图像中存在巨大的尺度差异。

然而,现有方法主要采用基于单标签预训练的基础网络模型提取遥感图像的整体特征,难以捕获不同尺度、空间分辨率遥感图像的特异特征。因此,如何学习遥感图像的多尺度特征是未来该领域内至关重要的问题。

4.3 类内差异较大问题

遥感图像存在目标物体变化多样、尺度参差的特性,使得多标签遥感图像分类存在类内差异较大的问题,主要表现在3方面:

首先,由于地表物体丰富多样,地物外观在形状、分布、样式和规模上参差不齐,使得同一语义类别的地物对象在视觉特征上差异较大,这为正确细粒度分类遥感图像带来难度。其次,由于成像设备的不同,同一语义物体在不同遥感图像中呈现的颜色和色彩饱和度可能存在较大差异,进而导致该物体的视觉特征差异。最后,受到成像条件的影响,天气、云、雾等自然因素以及时间因素均可导致同一地物在不同场景下呈现视觉特征多样性。例如,河流在不同遥感成像中以不同的形状、颜色呈现,存在很大的视觉差异。

因此,在接下来的研究中,如何精准获取具有不同视觉特征的同一语义对象的表达具有重大研究意义。

4.4 类间相似度高问题

在遥感图像中,目标物体存在标签层面的高度语义重叠、图像层面的高度特征重合的类间相似性现象。在标签层面,不同类别的场景中可能存在相同的对象,导致不同标签出现语义信息重叠的现象。例如,标签bridge和overpass都包含桥梁语义,实际多标签分类中难以区分。在图像层面,不同目标在视觉成像上彼此相似,例如,trees和grass都呈现绿色区域,由此获取的图像特征也十分相近,难以界定; water和sea都是存在大片水域区域,图像特征高度相似。因此,遥感图像的类间相似度高的特性为多标签分类器准确预测细粒度标签带来一定的难度。

4.5 遥感数据标注成本较高

构建高质量的多标签遥感图像分类数据集一直是遥感领域计算机视觉任务的极具挑战性的工程。原因除了图像采集需要昂贵的专业设备之外,遥感数据标注成本较高也是普遍存在的问题。相较于传统自然图像标注任务,遥感图像的标注工作依赖背景知识,因此需要花费更高的成本,其原因有2点: 首先,遥感图像由于画幅较宽、地物类别稀疏等因素,识别和标注目标标签需要耗费更大的人力; 进而,由于上述提到的标签类内差异较大、类间相似度高等问题,细粒度区分不同地物对象需要更精准的专业知识和加倍的工作量。

5 总结

本文聚焦遥感领域的多标签图像分类研究的现状与展望。首先,介绍了多标签遥感图像分类的基础知识,包括问题定义、常用的数据集和评价指标; 进而,对该领域的综合进展进行系统总结,重点关注多标签遥感图像分类过程中的2个关键任务: 遥感图像特征提取和标签特征提取; 随后,对该任务的挑战与未来展望进行分析与总结。针对遥感图像尺度差异、类内差异较大、类间相似度高的问题,对多标签遥感图像进行细粒度特征提取是该任务的研究根本。同时,如何利用多模态遥感图像,进行模态关联、模态对齐及模态匹配,从而融合多模态信息,以提取更有效的图像特征,也是该任务的研究热点方向。除此之外,缺乏大规模数据集也是该任务普遍存在的问题,同时大规模预训练或大模型训练也是保证良好下游应用的基础性发展方向。

参考文献

陈春芳, 边小勇, 费雄君, .

弱监督多示例子概念学习的遥感场景分类

[J]. 小型微型计算机系统, 2022, 43(1):76-83.

[本文引用: 1]

遥感场景分类是近年来计算机视觉和表示学习领域的热门研究课题,其主要工作是基于学习到的特征信息自动分类图像场景.传统上场景分类方法忽略了场景中多个子概念的学习,进而影响到场景语义识别.为了解决上述问题,文中提出一种弱监督多示例子概念学习(Weakly Supervised Multi-Instance Sub-concept Learning)的遥感场景分类方法.首先,基于弱监督定位网络从逐类响应图中预测峰值坐标,以定位感兴趣的示例区域;其次,将峰值坐标信息回溯到卷积层,自动截取多个示例特征组成示例袋作为多示例聚合网络的输入.然后,在多示例聚合网络上嵌入一个子概念层,迭代学习子概念与示例之间的匹配分数,再将所有的示例进行聚合生成示例袋概率分数;最后,组合两个损失函数,联合训练整个网络,得到富于判别的分类模型.在AID、NWPU-RESISC45和CIFAR10/100数据集上进行了分类实验,结果表明,所提方法有效提高了遥感场景分类性能.

Chen C F, Bian X Y, Fei X J, et al.

Weakly supervised multi-instance sub-concept learning for remote sensing scene classification

[J]. Journal of Chinese Computer Systems, 2022, 43(1):76-83.

[本文引用: 1]

Li K, Wan G, Cheng G, et al.

Object detection in optical remote sensing images:A survey and a new benchmark

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 159:296-307.

[本文引用: 1]

Yuan X H, Shi J F, Gu L C.

A review of deep learning methods for semantic segmentation of remote sensing imagery

[J]. Expert Systems with Applications, 2021, 169:114417.

[本文引用: 1]

赵泽亚, 杨迪, 梁小虎, .

海量遥感数据的存储迁移策略研究

[J]. 信息工程大学学报, 2020, 21(1):115-119.

[本文引用: 1]

Zhao Z Y, Yang D, Liang X H, et al.

Study on storage and migration strategy of massive remote sensing data

[J]. Journal of Information Engineering University, 2020, 21(1):115-119.

[本文引用: 1]

白俊龙, 王章琼, 闫海涛.

K-means聚类引导的无人机遥感图像阈值分类方法

[J]. 自然资源遥感, 2021, 33(3):114-120.doi:10.6046/zrzyyg.2020301.

[本文引用: 1]

Bai J L, Wang Z Q, Yan H T.

A K-means clustering-guided threshold-based approach to classifying UAV remote sensed images

[J]. Remote Sensing for Natural Resources, 2021, 33(3):114-120.doi:10.6046/zrzyyg.2020301.

[本文引用: 1]

涂兵, 张晓飞, 张国云, .

递归滤波与KNN的高光谱遥感图像分类方法

[J]. 国土资源遥感, 2019, 31(1):22-32.doi:10.6046/gtzyyg.2019.01.04.

[本文引用: 1]

Tu B, Zhang X F, Zhang G Y, et al.

Hyperspectral image classification via recursive filtering and KNN

[J]. Remote Sensing for Land and Resources, 2019, 31(1):22-32.doi:10.6046/gtzyyg.2019.01.04.

[本文引用: 1]

Wang T, Zhang H S, Lin H, et al.

Textural- spectral feature-based species classification of mangroves in Mai Po Nature Reserve from WorldView-3 imagery

[J]. Remote Sensing, 2015, 8(1):24-35.

[本文引用: 1]

Zhou W, Song Y Q, Pan Z K, et al.

Classification of urban construction land with WorldView-2 remote sensing image based on classification and regression tree algorithm

[C]// 2017 IEEE International Conference on Computational Science and Engineering(CSE) and IEEE International Conference on Embedded and Ubiquitous Computing(EUC), 2017:277-283.

[本文引用: 1]

Hamidishad N, Cesar R Jr.

Object-based method for identifying new constructions around water reservoirs:Preliminary results

[C]// Anais Estendidos da Conference on Graphics,Patterns and Images(SIBGRAPI), 2019, 32:172-175.

[本文引用: 2]

Yessou H, Sumbul G, Demir B.

A comparative study of deep learning loss functions for multi-label remote sensing image classification

[C]// 2020 IEEE International Geoscience and Remote Sensing Symposium(IGARSS), 2020:1349-1352.

[本文引用: 1]

Chaudhuri B, Demir B, Chaudhuri S, et al.

Multilabel remote sensing image retrieval using a semisupervised graph-theoretic method

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(2):1144-1158.

[本文引用: 1]

Xia G S, Hu J W, Hu F, et al.

AID:A benchmark data set for performance evaluation of aerial scene classification

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(7),3965-3981.

[本文引用: 2]

Hua Y, Mou L, Jin P, et al.

MultiScene:A large-scale dataset and benchmark for multiscene recognition in single aerial images

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021(60):5010213.

[本文引用: 1]

Qi X, Zhu P, Wang Y, et al.

MLRSNet:A multi-label high spatial resolution remote sensing dataset for semantic scene understanding

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 169:337-350.

[本文引用: 1]

Sumbul G, Charfuelan M, Demir B, et al.

Bigearthnet:A large-scale benchmark archive for remote sensing image understanding

[C]// IGARSS 2019-2019 IEEE International Geoscience and Remote Sensing Symposium.IEEE, 2019:5901-5904.

[本文引用: 2]

Sumbul G, Wall A D, Kreuziger T, et al.

BigEarthNet-MM:A large scale multi modal multi label benchmark archive for remote sensing image classification and retrieval

[J]. IEEE Geoscience and Remote Sensing Magazine, 2021, 9(3):174-180.

[本文引用: 1]

Cheng G, Xie X, Han J, et al.

Remote sensing image scene classification meets deep learning:Challenges,methods,benchmarks,and opportunities

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2020, 13:3735-3756.

[本文引用: 1]

Blaschke T, Strobl J.

What’s wrong with pixels? Some recent developments interfacing remote sensing and GIS

[J]. Interfacing Remote Sensing and GIS, 2001, 6(1):12-17.

[本文引用: 1]

Chen T, Wang Z, Li G, et al.

Recurrent attentional reinforcement learning for multi-label image recognition

[C]// Proceedings of the AAAI Conference on Artificial Intelligence, 2018, 32(1).

[本文引用: 1]

曾黎, 徐慧颖, 陈晓昊, .

深度学习在高分遥感图像场景分类中的应用

[J]. 计算机工程与应用, 2021, 57(10):57-64.

DOI:10.3778/j.issn.1002-8331.2101-0427      [本文引用: 1]

高分遥感图像场景分类致力于自动辨别土地利用或覆盖的类别,在军事和国土资源勘探等领域具有重要的应用价值。基于深度学习的高分遥感图像场景分类方法取得了比传统方法更好的效果,也是当前研究的热点,对此类方法进行归纳总结和综合评估。按照监督方式的不同,对基于深度学习的流行方法进行了逐类分析。对不同监督方式下的流行方法在三个公开数据集上进行了定量实验评估。总结了基于不同监督方式方法的特点,并对下一步发展趋势进行了展望。

Zeng L, Xu H Y, Chen X H, et al.

Application of deep learning in scene classificationof high-resolution remote sensing images

[J]. Computer Engineering and Applications, 2021, 57(10):57-64.

[本文引用: 1]

蔡之灵, 翁谦, 叶少珍, .

基于Inception-V3模型的高分遥感影像场景分类

[J]. 国土资源遥感, 2020, 32(3):80-89.doi:10.6046/gtzyyg.2020.03.11.

[本文引用: 1]

Cai Z L, Weng Q, Ye S Z, et al.

Remote sensing image scene classification based on Inception-V3

[J]. Remote Sensing for Land and Resources, 2020, 32(3):80-89.doi:10.6046/gtzyyg.2020.03.11.

[本文引用: 1]

Zeggada A, Melgani F, Bazi Y.

A deep learning approach to UAV image multilabeling

[J]. IEEE Geoscience and Remote Sensing Letters, 2017, 14(5):694-698.

[本文引用: 1]

Shendryk I, Rist Y, Lucas R, et al.

Deep learning:A new approach for multi-label scene classification in planetscope and Sentinel-2 imagery

[C]// IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium.IEEE, 2018:1116-1119.

[本文引用: 1]

Karalas K, Tsagkatakisg G, Zervakism M, et al.

Land classification using remotely sensed data:Going multi-label

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54:3548-3563.

[本文引用: 1]

Melo A, Paulheim H.

Local and global feature selection for multi-label classification with binary relevance

[J]. Artificial Intelligence Review, 2019, 51(1):33-60.

[本文引用: 1]

Fdez-Díaz M, Fdez-Díaz L, Mena D, et al.

Improving the ε-approximate algorithm for probabilistic classifier chains

[J]. Knowledge and Information Systems, 2020, 62(7):2709-2738.

[本文引用: 1]

Zhou C L, Yuan J S.

Multi-label learning of part detectors for heavily occluded pedestrian detection

[C]// Proceedings of the IEEE International Conference on Computer Vision(ICCV). 2017:3486-3495.

[本文引用: 1]

Tsagkatakis G, Tsakalides P.

Deep feature learning for hyperspectral image classification and land cover estimation

[J]. Environmental Science,Mathematics, 2016, 6:435-446.

[本文引用: 1]

Cevikalp H, Benligiray B, Gerek O N.

Semi-supervised robust deep neural networks for multi-label image classification

[J]. Pattern Recognition, 2020, 100:107164.

[本文引用: 1]

Zhang T, Yan W, Li J, et al.

Multiclass labeling of very high-resolution remote sensing imagery by enforcing nonlocal shared constraints in multilevel conditional random fields model

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2016, 9(7):2854-2867.

[本文引用: 1]

Wang C, Zhang P, Zhang Y, et al.

A multi-label hyperspectral image classification method with deep learning features

[C]// Proceedings of the International Conference on Internet Multimedia Computing and Service, 2016:127-131.

[本文引用: 2]

Koda S, Zeggada A, Melgani F, et al.

Spatial and structured SVM for multilabel image classification

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(10):5948-5960.

[本文引用: 2]

华远盛.

深度学习在多标签遥感影像分类中应用的研究现状

[J]. 科学技术创新, 2020(1):44-45.

[本文引用: 1]

Hua Y S.

Research status of application of deep learning in multi-label remote sensing image classification

[J]. Scientific and Technological Innovation, 2020(1):44-45.

[本文引用: 1]

Hua Y, Mou L, Zhu X X.

Recurrently exploring class-wise attention in a hybrid convolutional and bidirectional LSTM network for multi-label aerial image classification

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2019, 149:188-199.

DOI:10.1016/j.isprsjprs.2019.01.015      PMID:31007387      [本文引用: 2]

Aerial image classification is of great significance in the remote sensing community, and many researches have been conducted over the past few years. Among these studies, most of them focus on categorizing an image into one semantic label, while in the real world, an aerial image is often associated with multiple labels, e.g., multiple object-level labels in our case. Besides, a comprehensive picture of present objects in a given high-resolution aerial image can provide a more in-depth understanding of the studied region. For these reasons, aerial image multi-label classification has been attracting increasing attention. However, one common limitation shared by existing methods in the community is that the co-occurrence relationship of various classes, so-called class dependency, is underexplored and leads to an inconsiderate decision. In this paper, we propose a novel end-to-end network, namely class-wise attention-based convolutional and bidirectional LSTM network (CA-Conv-BiLSTM), for this task. The proposed network consists of three indispensable components: (1) a feature extraction module, (2) a class attention learning layer, and (3) a bidirectional LSTM-based sub-network. Particularly, the feature extraction module is designed for extracting fine-grained semantic feature maps, while the class attention learning layer aims at capturing discriminative class-specific features. As the most important part, the bidirectional LSTM-based sub-network models the underlying class dependency in both directions and produce structured multiple object labels. Experimental results on UCM multi-label dataset and DFC15 multi-label dataset validate the effectiveness of our model quantitatively and qualitatively.

Wang X, Xiong X, Ning C.

Multi-label remote sensing scene classification using multi-bag integration

[J]. IEEE Access, 2019(7):120399-120410.

[本文引用: 1]

Zhang J L, Zhang J Y, Dai T, et al.

Exploring weighted dual graph regularized non-negative matrix tri-factorization based collaborative filtering framework for multi-label annotation of remote sensing images

[J]. Remote Sensing, 2019, 11(8):922.

[本文引用: 2]

Khan N, Chaudhuri U, Banerjee B, et al.

Graph convolutional network for multi-label VHR remote sensing scene recognition

[J]. Neurocomputing, 2019, 357:36-46.

[本文引用: 1]

Hua Y S, Lobry S., Mou L C, et al.

Learning multi-label aerial image classification under label noise:A regularization approach using word embeddings

[C]// 2020 IEEE International Geoscience and Remote Sensing Symposium(IGARSS), 2020,525-528.

[本文引用: 3]

Hao Q B, Li S T, Kang X D.

Multilabel sample augmentation-based hyperspectral image classification

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020, 58:4263-4278.

[本文引用: 1]

Yang Y, Newsam S.

Bag-of-visual-words and spatial extensions for land-use classification

[C]// ACM Sigspatial International Conference on Advances in Geographic Information Systems. 2010:270-279.

[本文引用: 1]

Song Z L, Zhang J Q.

Image registration approach with scale-invariant feature transform algorithm and tangent-crossing-point feature

[J]. Journal of Electronic Imaging, 2020, 29:023010.

[本文引用: 1]

姜亚楠, 张欣, 张春雷, .

基于多尺度LBP特征融合的遥感图像分类

[J]. 自然资源遥感, 2021, 33(3):36-44.doi:10.6046/zrzyyg.2020303.

[本文引用: 1]

Jiang Y N, Zhang X, Zhang C L, et al.

Classification of remote sensing images based on multi-scale feature fusion using local binary patterns

[J]. Remote Sensing for Natural Resources, 2021, 33(3):36-44.doi:10.6046/zrzyyg.2020303.

[本文引用: 1]

Vincent P, Larochelle H, Lajoie I, et al.

Stacked denoising autoencoders:Learning useful representations in a deep network with a local denoising criterion

[J]. Journal of Machine Learning Research, 2010, 11(12).

[本文引用: 1]

Hinton G E, Simon O, Teh Y W.

A fast learning algorithm for deep belief nets

[J]. Neural Computation, 2006, 18:1527-1554.

DOI:10.1162/neco.2006.18.7.1527      PMID:16764513      [本文引用: 1]

We show how to use "complementary priors" to eliminate the explaining-away effects that make inference difficult in densely connected belief nets that have many hidden layers. Using complementary priors, we derive a fast, greedy algorithm that can learn deep, directed belief networks one layer at a time, provided the top two layers form an undirected associative memory. The fast, greedy algorithm is used to initialize a slower learning procedure that fine-tunes the weights using a contrastive version of the wake-sleep algorithm. After fine-tuning, a network with three hidden layers forms a very good generative model of the joint distribution of handwritten digit images and their labels. This generative model gives better digit classification than the best discriminative learning algorithms. The low-dimensional manifolds on which the digits lie are modeled by long ravines in the free-energy landscape of the top-level associative memory, and it is easy to explore these ravines by using the directed connections to display what the associative memory has in mind.

Hinton G E, Salakhutdinov R.

Reducing the dimensionality of data with neural networks

[J]. Science, 2006, 313:504-507.

DOI:10.1126/science.1127647      PMID:16873662      [本文引用: 1]

High-dimensional data can be converted to low-dimensional codes by training a multilayer neural network with a small central layer to reconstruct high-dimensional input vectors. Gradient descent can be used for fine-tuning the weights in such "autoencoder" networks, but this works well only if the initial weights are close to a good solution. We describe an effective way of initializing the weights that allows deep autoencoder networks to learn low-dimensional codes that work much better than principal components analysis as a tool to reduce the dimensionality of data.

Fang S, Zhang K, Wang Y B, et al.

Multi-label hyperspectral classification with discriminative features

[C]// 2021 IEEE International Geoscience and Remote Sensing Symposium IGARSS, 2021:3233-3236.

[本文引用: 1]

Zhang M L, Zhou Z H.

ML-KNN:A lazy learning approach to multi-label learning

[J]. Pattern Recognition, 2007, 40(7):2038-2048.

[本文引用: 1]

Wang J, Yang Y, Mao J H, et al.

CNN-RNN:A unified framework for multi-label image classification

[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016:2285-2294.

[本文引用: 1]

Li Y, Song Y L, Luo J B.

Improving pairwise ranking for multi-label image classification

[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017:3617-3625.

[本文引用: 1]

Yan Y F, Huang S J.

Cost-effective active learning for hierarchical multi-label classification

[C]// Proceedings of the 27th International Joint Conference on Artificial Intelligence, 2018:2962-2968.

[本文引用: 1]

Li Y S, Chen R X, Zhang Y J, et al.

Multi-label remote sensing image scene classification by combining a convolutional neural network and a graph neural network

[J]. Remote Sensing, 2020, 12(23):4003.

[本文引用: 1]

Aksoy A K, Ravanbakhsh M, Kreuziger T, et al.

A novel uncertainty-aware collaborative learning method for remote sensing image classification under multi-label noise

[J]. CoRR,vol. vol.abs/2105.05496,2021.

[本文引用: 1]

El-Khamy S E, Al-Kabbany A, El-Bana S.

MLRS-CNN-DWTPL:A new enhanced multi-label remote sensing scene classification using deep neural networks with wavelet pooling layers

[C]// 2021 International Telecommunications Conference(ITC-Egypt), 2021:1-5.

[本文引用: 1]

Ji J C, Jing W P, Chen G S, et al.

Multi-label remote sensing image classification with latent semantic dependencies

[J]. Remote Sensing, 2020, 12:1110.

[本文引用: 1]

Sumbul G, Demir B.

A deep multi-attention driven approach for multi-label remote sensing image classification

[J]. IEEE Access, 2020, 8:95934-95946.

[本文引用: 1]

Yang M H, Liu H, Gao L, et al.

DCA-GCN:A dual-branching channel attention and graph convolution network for multi-label remote sensing image classification

[J]. Journal of Applied Remote Sensing, 2021, 15:044519.

[本文引用: 1]

Diao Y, Chen J Z, Qian Y.

Multi-label remote sensing image classification with deformable convolutions and graph neural networks

[C]// IGARSS 2020—2020 IEEE International Geoscience and Remote Sensing Symposium, 2020:521-524.

[本文引用: 1]

Huang S J, Gao W, Zhou Z H.

Fast multi-instance multi-label learning

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, 41:2614-2627.

[本文引用: 2]

Zhou Z H, Zhang M L.

Multi-instance multi-label learning with application to scene classification

[C]// Advances in Neural Information Processing Systems, 2006:1609-1616.

[本文引用: 1]

Mohamed D.

Multi-instance multi-label with application to high resolution remote sensing images

[J]. Journal of Physics:Conference Series, 2018, 18:614-623.

[本文引用: 1]

Aksoy A K, Ravanbakhsh M, Demir B.

Multi-label noise robust collaborative learning for remote sensing image classification

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2022:1-14.

[本文引用: 1]

Aksoy A K, Ravanbakhsh M, Kreuziger T, et al.

A consensual collaborative learning method for remote sensing image classification under noisy multi-labels

[C]// 2021 IEEE International Conference on Image Processing(ICIP), 2021:3842-3846.

[本文引用: 1]

Burgert T, Ravanbakhsh M, Demir B.

On the effects of different types of label noise in multi-label remote sensing image classification

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60:5413713.

[本文引用: 1]

Li Q, Qiao M Y, Bian W, et al.

Conditional graphical lasso for multi-label image classification

[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016:2977-2986.

[本文引用: 1]

Hua Y S, Mou L C, Zhu X X.

Label relation inference for multi-label aerial image classification

[C]// IEEE International Geoscience and Remote Sensing Symposium(IGARSS), 2019:5244-5247.

[本文引用: 1]

Chen J Z, Qian Y.

Hierarchical multi-label ship recognition in remote sensing images using label relation graphs

[C]// 2021 IEEE International Geoscience and Remote Sensing Symposium(IGARSS), 2021:4968-4971.

[本文引用: 1]

Zhang J J, Wu Q, Shen C H, et al.

Multi-label image classification with regional latent semantic dependencies

[J]. IEEE Transactions on Multimedia, 2018, 20(10):2801-2813.

[本文引用: 2]

Zhu F, Li H S, Ouyang W L, et al.

Learning spatial regularization with image-level supervisions for multi-label image classification

[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2017:2027-2036.

[本文引用: 2]

Kipf T N, Welling M.

Semi-supervised classification with graph convolutional networks

[EB/OL]. arXiv.(2016-09-09) [2023-03-27]https://arxiv.org/abs/1609.02907.

URL     [本文引用: 1]

Wang Y, He D L, Li F, et al.

Multi-label classification with label graph superimposing

[EB/OL]. arXiv.(2019-11-21) [2023-03-27]https://arxiv.org/abs/1911.09243.

URL     [本文引用: 2]

Li Y S, Chen R X, Zhang Y J, et al.

A CNN-GCN framework for multi-label aerial image scene classification

[C]// IEEE International Geoscience and Remote Sensing Symposium(IGARSS), 2020:1353-1356.

[本文引用: 1]

杨敏航, 陈龙, 刘慧, .

基于图卷积网络的多标签遥感图像分类

[J]. 计算机应用研究, 2021, 38(11):3439-3445.

[本文引用: 1]

Yang M H, Chen L, Liu H, et al.

Multi-label remote sensing image classification based on graph convolutional network

[J]. Application Research of Computer, 2021, 38(11):3439-3445.

[本文引用: 1]

Lin D, Lin J Z, Zhao L, et al.

Multi-label aerial image classification with a concept attention graph neural network

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 60:5602112.

[本文引用: 1]

Lin D, Lin J, Zhao L, et al.

Multilabel aerial image classification with unsupervised domain adaptation

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 60:5609613.

[本文引用: 1]

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发