自然资源遥感, 2025, 37(5): 91-100 doi: 10.6046/zrzyyg.2024259

技术方法

基于双重特征融合的复杂环境下滑坡检测方法

方留杨,1,2,3, 杨昌浩1, 舒东1, 杨学昆2,3, 陈兴通2,3, 贾志文1

1.昆明理工大学国土资源工程学院,昆明 650093

2.云南省交通规划设计研究院股份有限公司,昆明 650200

3.云南省数字交通重点实验室,昆明 650000

Landslide detection in complex environments based on dual feature fusion

FANG Liuyang,1,2,3, YANG Changhao1, SHU Dong1, YANG Xuekun2,3, CHEN Xingtong2,3, JIA Zhiwen1

1. Faculty of Land Resources Engineering,Kunming University of Science and Technology,Kunming 650093,China

2. Broadvision Engineering Consultants,Kunming 650200,China

3. Yunnan Key Laboratory of Digital Communications,Kunming 650000,China

责任编辑: 张仙

收稿日期: 2024-07-31   修回日期: 2024-10-23  

基金资助: 云南省科技计划项目“高原山地公路地质灾害遥感智能解译理论与方法研究”(202301AT070262)
“云南省数字交通重点实验室”(202205AG070008)
云南省人才项目“高层次人才培养支持计划”(YNWR-QNBJ-2020-031)

Received: 2024-07-31   Revised: 2024-10-23  

作者简介 About authors

方留杨(1987-),男,博士,正高级工程师,主要从事遥感数据处理、交通灾害防治技术研究与应用。Email:318647315@qq.com

摘要

我国西南地区滑坡灾害十分发育,利用遥感影像准确获取滑坡信息对于防灾减灾工作具有重要意义。复杂环境下由于遥感影像背景噪声的影响,传统的滑坡遥感检测方法易出现误识别现象。该文提出一种基于双重特征融合的复杂环境下滑坡识别网络(dual-fusion landslide detection network,DLDNet),可有效提高复杂环境下的滑坡检测精度。首先,在现有滑坡样本的基础上,使用数据增强方法模拟复杂环境下的滑坡样本;其次,采用ConvNeXt作为DLDNet的特征提取网络以提取更多复杂的滑坡特征;然后,引入使用可变形卷积改进的注意力模块聚焦滑坡信息;最后,设计了一种双重融合特征金字塔网络(dual-fusion feature pyramid network,DFPN)来充分融合不同尺度和不同感受野之间的特征信息。实验表明,DLDNet模型的边界框和分割平均精度(average precision,AP)可分别达56.9%和52.5%,与基线模型(Mask R-CNN)相比分别提高了10.4和10.7百分点,与其他滑坡检测模型相比,该模型有着更高的检测精度和更低的误判率。该方法能对复杂环境下的滑坡进行精确检测,可为滑坡灾害快速识别和应急响应提供参考。

关键词: 遥感影像; 目标识别; 滑坡提取; 深度学习; 特征融合

Abstract

Landslide disasters are frequent and widespread in southwestern China. The accurate identification and mapping of landslides using remote sensing imagery are of great significance for disaster prevention and mitigation. However,in complex environments,traditional remote sensing detection methods are often prone to misidentification due to background noise in the imagery. This paper proposed a dual-fusion landslide detection network (DLDNet) to improve landslide detection accuracy under challenging conditions. First,based on existing landslide samples,landslide simulation was conducted in complex environments using data augmentation techniques. Second,the ConvNeXt was adopted as the feature extraction backbone of DLDNet to capture more complex landslide features. Then,an attention module enhanced with deformable convolution was introduced to better focus on landslide-related information. Finally,a dual-fusion feature pyramid network (DFPN) was designed to thoroughly integrate feature information across different scales and receptive fields. The experimental results show that the proposed DLDNet achieved average precision (AP) scores of 56.9% for bounding box detection and 52.5% for segmentation,10.4 and 10.7 percentage points higher than those of the baseline model (Mask R-CNN). Compared with other landslide detection models,the DLDNet demonstrates higher detection accuracy and a lower false alarm rate. The method,characterized by accurate landslide detection in complex environments,can support rapid landslide identification and emergency response.

Keywords: remote sensing imagery; object detection; landslide extraction; deep learning; feature fusion

PDF (6315KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

方留杨, 杨昌浩, 舒东, 杨学昆, 陈兴通, 贾志文. 基于双重特征融合的复杂环境下滑坡检测方法[J]. 自然资源遥感, 2025, 37(5): 91-100 doi:10.6046/zrzyyg.2024259

FANG Liuyang, YANG Changhao, SHU Dong, YANG Xuekun, CHEN Xingtong, JIA Zhiwen. Landslide detection in complex environments based on dual feature fusion[J]. Remote Sensing for Land & Resources, 2025, 37(5): 91-100 doi:10.6046/zrzyyg.2024259

0 引言

滑坡是我国最常见的地质灾害之一,在西南地区复杂的山区环境下,滑坡灾害频繁发生[1]。滑坡灾害分布范围广、突发性强且破坏性大,对人类生命财产安全构成严重威胁[2-3]。遥感技术可以高效、快速地获取影像中的信息,高分辨率遥感影像因能提供更加丰富的地表信息被普遍应用于大范围的地质灾害调查中[4-5]。从海量的高分辨率遥感影像数据中快速准确地获取滑坡信息对于防灾减灾和应急救援工作的开展具有重要的意义。

传统的滑坡识别方法主要通过人工解译实现[6],该方法需要耗费大量精力且依赖于专家经验,无法充分发挥遥感数据规模大、更新速度快的优势。自动识别方法目前主要包括基于像元[7]、面向对象[8-10]、机器学习[11]以及深度学习[12-14]等方法。基于像元的滑坡识别方法主要针对中低分辨率遥感数据,这类数据难以提取图像对象,仅通过简单的像素代数运算提取滑坡信息。面向对象识别方法将研究单元扩大为区域内的所有像元,提高了数据的处理效率和提取精度,但该方法往往只针对特定区域,泛化能力有限。机器学习方法包括支持向量机[15]、随机森林[16]等,其通过更加复杂严密的科学计算提高了图像解译的精度,但该方法需要手动构建特征规则,自动化程度还需进一步提高。与机器学习方法相比,深度学习方法无需手动设计特征,并能够从原始影像中自动学习滑坡的复杂特征[17],捕捉其抽象表达,从而很快被广泛应用于滑坡灾害的识别。其中,卷积神经网络(convolutional neural networks,CNN)是滑坡识别任务中常用的深度学习网络[18]。杨昭颖等[19]基于光学遥感影像和数字高程模型(digital elevation model,DEM)数据,应用通道融合卷积神经网络进行滑坡识别,实验结果表明了该方法在大规模滑坡灾害排查中的有效性;Yu等[20]基于谷歌地球引擎(Google Earth Engine,GEE)建立了黄土高原历史滑坡样本数据库,通过改进YOLOX模型,实现了黄土滑坡的高精度自动检测;Yang等[21]使用数据增强策略,利用滑坡诱发因素作为补充,结合Mask R-CNN模型进行滑坡识别,减少了对背景的错误提取;唐小川等[22]提出一种基于多模态深度学习的智能滑坡识别模型,结合DEM和山体阴影图提升了植被覆盖条件下的滑坡识别精度;蒋伟杰等[23]提出了一种针对滑坡灾害遥感图像语义分割模型,通过替换特征提取器并引入通道注意力机制等方式提升了提高滑坡检测性能。基于深度学习的滑坡识别方法已被证明能够很好地满足高精度、自动化的滑坡信息提取需求,但在已有的研究中,研究对象多为在光谱、颜色和纹理特征上与周边环境区别较大的滑坡[24],如强震、强降雨等导致的新生滑坡。然而,在面对如裸地、建筑、道路等各类与滑坡图像特征相近地物干扰的复杂环境时,往往存在很多误识别现象,如何有效地避免这些易混淆地物对滑坡识别精度的影响,始终是滑坡检测任务亟待解决的问题之一。

在滑坡灾害的应急救援和灾后评估等工作中,滑坡灾害的位置及形状信息都发挥着关键作用。Mask R-CNN[25]模型能同时获取滑坡的边界框和分割信息,因此本文以Mask R-CNN为基础网络,针对特征相近地物干扰环境下误识别率高导致滑坡检测精度低的问题,对模型进行改进,提出基于双重特征融合的滑坡识别方法(dual-fusion landslide detection network,DLDNet)。DLDNet使用ConvNeXt网络提取滑坡特征信息,引入卷积块注意力模块(convolutional block attention module,CBAM)[26]并对其空间注意力分支进行改进,提出双重融合特征金字塔网络(dual-fusion feature pyramid network,DFPN)融合多尺度特征信息,同时通过数据增强方法模拟复杂环境下的滑坡样本提高检测模型的泛化能力,以提升相似地物干扰条件下的滑坡检测精度,减少在各种背景噪声影响下的滑坡误识别现象。

1 研究方法

1.1 DLDNet滑坡检测网络结构

DLDNet滑坡检测网络结构如图1所示。首先使用ConvNeXt特征提取网络获取不同尺度的丰富的滑坡特征信息,提取的特征图通过改进的CBAM模块分别从通道和空间维度聚焦滑坡信息;然后使用DFPN网络充分融合不同尺度和不同感受野的特征信息;将得到特征图输入区域生成网络以生成不同大小的候选框并对特征图进行截取,并使用感兴趣区域对齐模块将不同尺度的特征图调整到相同大小;随后应用全连接层进行分类和边界框回归操作,应用全卷积神经网络实现滑坡的像素级分割,最终获得滑坡的预测框和分割结果。

图1

图1   DLDNet网络结构

Fig.1   DLDNet network structure


1.2 ConvNeXt特征提取网络

在面对复杂环境下的多任务滑坡检测时,传统的ResNet网络由于特征提取能力有限,难以提取出准确的滑坡信息,因此采用综合性能更强的ConvNeXt网络作为DLDNet的主干特征提取网络以提升模型表达能力。ConvNeXt是由Liu等[27]借鉴以往研究人员设计Transformer的经验,基于ResNet改进的卷积网络,作者使用深度卷积,采用倒置瓶颈结构、增大卷积核等策略提升了模型的性能,同时保证了较快的推理速度。本文综合考虑滑坡数据集的大小与模型推理速度,选取ConvNeXt-T版本作为主干特征提取网络,ConvNeXt-T的详细结构如图2所示。当滑坡数据输入之后,使用4×4卷积进行下采样,随后通过堆叠数为3,3,9,3的ConvNeXt块提取滑坡特征信息,最终得到通道数分别为96,192,348,768的4个特征层供后续使用。在ConvNeXt块中首先使用7×7深度卷积捕捉图像中的上下文信息;紧接着使用层归一化将输入数据进行规范化,然后通过1×1卷积对不同通道上的信息进行提取;接下来通过GELU激活函数帮助网络学习复杂和非线性的函数,并再次使用1×1卷积提取信息;最后将得到的特征图与输入特征图进行相加并输出ConvNeXt块特征提取结果。

图2

图2   ConvNeXt网络结构

Fig.2   ConvNeXt network structure


1.3 改进的CBAM模块

CBAM是一种轻量级注意力模块,包括通道注意力和空间注意力,改进的CBAM模块结构如图3所示。其能够根据任务需求和上下文内容动态地调整特征图中每个通道和空间位置的重要性,从而能够更加全面地获取特征中的关键信息,提升模型的学习效率和泛化能力。

图3

图3   改进的CBAM结构

Fig.3   Improved CBAM structure


1.3.1 通道注意力模块

通道注意力模块结构如图3中A所示。在通道注意力部分,给定一个中间特征层,首先通过最大池化和平均池化操作来获取聚合的特征信息,再将得到的结果送入共享的多层感知机(multilayer perceptron,MLP)来评估通道间的注意力,2条池化分支经过MLP后进行元素相加并使用Sigmoid激活函数增强模型对重要通道特征的关注度,最终得到通道注意力的输出McX),将McX)与输入特征X逐元素相乘作为通道注意力的输出X'。计算公式为:

$\begin{array}{c}{M}_{c}\left(X\right)=\sigma \left(MLP\right(AvgPool\left(X\right))+MLP(MaxPool\left(X\right)\left)\right)=\sigma \left({W}_{1}\right({W}_{0}\left({X}_{avg}^{c}\right))+{W}_{1}({W}_{0}\left({X}_{max}^{c}\right)\left)\right)\end{array}$
X'=McX)⊗X

式中:σ为Sigmoid激活函数;W0W1MLP的权重;AvgPool()和MaxPool()分别为平均池化和最大池化操作;${X}_{avg}^{c}$${X}_{max}^{c}$分别为平均池化和最大池化通道维度特征图;⊗为逐元素相乘运算。

1.3.2 改进空间注意力模块

对于空间注意力模块而言,卷积操作的感受野决定了空间注意力模块的性能[28],传统的卷积操作在固定的感受野内进行,对于形状规则的物体可能会有更好的效果,但滑坡的形状因其发展阶段、地质条件和触发因素的不同而表现出显著的多样性,传统的卷积操作在处理不规则的滑坡目标时具有一定的局限性。可变形卷积通过引入变形操作来适应目标形状,允许特征的感受野自适应地变形以适应滑坡形状,使得模型能够更好地捕捉目标的真实形态,从而提高滑坡识别模型的表现力和鲁棒性。因此本文在CBAM模块的空间分支上,采用可变形卷积来聚合空间特征。

空间注意力模块结构如图3中B所示。在空间注意力部分,将通道注意力的输出X'作为空间注意力的输入,依旧使用最大池化和平均池化操作来对输入特征图进行压缩。但空间注意力作为通道注意力的补充,关注的是特征间的空间关系,因此压缩维度变成了通道层面上的压缩,最终得到空间维度的${X}_{avg}^{s}$${X}_{max}^{s}$特征图,将这2个特征图进行拼接之后,使用可变形卷积来聚合空间特征,并通过Sigmoid激活函数得到最终的空间注意力特征图MsX),最后将MsX)与输入特征X'逐元素相乘,得到最终的输出特征X″。计算公式为:

MsX)=σf7×7([AvgPoolX');MaxPoolX')])
=σf7×7([${X}_{avg}^{s}$${X}_{max}^{s}$])) ,
X″=MsX')⊗X'

式中:σ为Sigmoid激活函数;⊗为逐个元素相乘运算;f为可变形卷积操作;上标为卷积核大小。

1.4 DFPN结构

特征金字塔(feature pyramid network,FPN)[29]利用网络中的特征层次结构生成具有不同分辨率的特征映射来实现特征多尺度的融合,但是FPN存在2个明显的问题:①不同尺度的特征之间存在较大的语义差距,融合多个具有较大语义差距的特征会导致信息减少;②低层特征可以通过更高层次特征的更强语义信息进行增强,但特征金字塔最高层由于通道数的减少反而丢失了信息,并且当高分辨率图像输入时还存在感受野和特征图之间的矛盾。

针对上述问题,DFPN结构引入了上下文提取模块(context extraction module,CEM)[30]并且使用双重融合策略。CEM模块能够从多个感受野中探索物体的上下文信息,丰富了感受野的同时减少了特征金字塔最高层中特征图的信息丢失,该模块首先将特征提取网络输出的最后一层特征图分别利用3,6,12,18,24空洞率的空洞卷积来提取特征,并通过密集连接方式将拥有不同感受野的特征图进行连接,密集连接的特征复用机制有助于加强特征传播,提高网络对多尺度信息的利用。DFPN通过继续添加一条自顶向下的路径作为补充信息,从而实现双重特征融合,使用二次横向连接对初次融合得到的4个特征层以及CEM模块获得的特征层进行多尺度融合,以进一步融合高层、低层以及不同感受野层之间的特征信息。通过引入CEM模块和使用双重融合策略,使得滑坡识别模型在各个层次上都能获取到准确的细节特征,从而提高滑坡的检测精度。DFPN结构如图4所示。将4个不同尺度的特征层输入DFPN结构后,首先使用1×1卷积调整特征层通道数,其次使用上采样调整特征图大小并与下一层特征图融合,融合得到的4个特征图通过3×3卷积消除上采样的混叠效应。而最高层特征则通过CEM模块获得不同感受野的丰富信息,并与初次融合后的特征图进行二次融合,经过双重融合的特征图再经过3×3卷积融合信息之后得到4个特征图,最后将最上层特征图进行最大池化得到5个不同尺度的特征图层。

图4

图4   DFPN结构

Fig.4   DFPN structure


2 实验与分析

2.1 研究区概况及数据源

2.1.1 研究区概况

本文选取云南省南涧—景东高速公路(南景高速)周围区域为研究区,总面积约1 023.78 km2。研究区位于云南省大理白族自治州南涧彝族自治县和普洱市景东彝族自治县(图5),该地区地处云南省西部横断山脉纵谷区,主要山脉属云岭南北走向的无量山系和哀牢山系,地形地貌复杂多样,山高坡陡,海拔落差大,且受南景高速施工建设影响,斜坡稳定性下降,易发滑坡灾害。

图5

图5   研究区位置及高程信息

Fig.5   Study area location and elevation information


2.1.2 数据源及其预处理

研究选用自制的南景滑坡数据集和开源的毕节滑坡数据集[24]进行实验。南景滑坡数据集采用高分二号卫星获取的空间分辨率为0.8 m的遥感影像,拍摄时间为2020年8月27日。首先对获取的遥感影像进行辐射定标、大气校正、正射纠正、图像融合等预处理,然后对研究区内的滑坡进行独立滑坡裁剪,独立滑坡裁剪保留了完整的滑坡实体,更有利于检测模型提取滑坡特征。毕节滑坡数据集由武汉大学季顺平教授团队制作完成(http://gpcv.whu.edu.cn/data/Bijie_pages.html),包括从2018年5—8月获取的TripleSat卫星图像中裁剪的770张滑坡影像及对应滑坡形状掩模和DEM数据,其中滑坡影像的空间分辨率为0.8 m。

在对所有滑坡样本进行人工标注之后,分别使用CutMix[31]和Mosaic[32]数据增强方法从颜色、形态和光谱特性等方面模拟复杂环境下的滑坡样本,以增加滑坡数据的多样性和提升模型的泛化性及鲁棒性。模拟复杂环境下的滑坡样本如图6所示,其中红色部分为滑坡目标。CutMix方法通过将滑坡实例叠加到特征相似环境下从而实现复杂环境的模拟(如图6(a));Mosaic方法通过将1张滑坡影像与3张相似环境的非滑坡影像进行拼接从而实现复杂环境的模拟(如图6(b)(c))。经过数据增强之后混合滑坡数据,最终共得到1 330张滑坡遥感影像,按9∶1划分训练集和测试集进行实验。

图6

图6   模拟复杂环境下的滑坡样本

Fig.6   Simulated landslide samples in a complex environment


2.2 实验设置与评价指标

为了评估所提出方法的性能,本文使用平均精度(average precision,AP)作为主要评价指标。AP表示在10个不同交并比(intersection of union,IoU)阈值下(0.5~0.95,步长为0.05)的精度的均值,本文同时采用AP50和AP75,即在IoU阈值为0.5和0.75时的AP进行辅助评价。因为滑坡监测网络包含识别和分割2个任务,因此AP,AP50和AP75还具体分为边界框精度和分割精度。

实验在Windows系统的Pytorch框架下完成,使用mmdet仓库进行实验与改进,图形处理器(graphi-cs processing unit,GPU)为NVIDIA GeForce RTX 3060 12G,CPU为Intel(R) Core(TM) i5-12400F,运行内存为16 GB。编程语言为Python 3.9,torch版本为1.13.0,mmdet版本为3.1.0。模型训练过程中使用AdamW优化器来优化模型,batch size为4,初始学习率为1×10-4,衰减权重为0.05,共训练100个epoch,为了加快训练收敛速度,在训练时使用官方提供的预训练模型。最后对测试集中的所有滑坡目标进行检测,并统计相应评价指标。

2.3 消融实验

2.3.1 DFPN消融实验

为了验证所提出的DFPN中双重融合结构以及CEM模块的有效性,使用滑坡影像数据进行了消融实验,基线模型为基于ResNet-101特征提取网络和FPN结构的Mask R-CNN模型,在相同实验条件下,与基线模型进行对比,消融实验结果如表1所示。

表1   DFPN消融实验结果

Tab.1  Ablation experiments results of DFPN (%)

序号双重
融合
CEM边界框精度分割精度
APAP50AP75APAP50AP75
实验1××46.583.252.341.881.442.5
实验2×48.286.252.942.881.743.9
实验348.586.854.343.281.844.3

新窗口打开| 下载CSV


表1实验结果可以看出,在FPN的基础上使用双重融合策略,其边界框和分割AP分别提高了1.7和1.0百分点,在不同IoU阈值下的边界框和分割平均精度也均有一定程度的提升,这说明了双重融合结构能够进一步融合滑坡特征信息,从而提升模型在滑坡识别和分割任务中的性能。当同时使用双重融合结构和引入上下文提取模块时,边界框和分割AP达到最高的48.5%和43.2%,AP50AP75也达到了最高精度,这是因为双重融合结构使得滑坡检测模型在各个尺度上都能获取到准确的细节特征,而上下文提取模块能够获取高分辨率图像中不同感受野的信息,减少了信息的损失从而提高了滑坡检测的精度,证明了DFPN中双重融合结构以及CEM模块在滑坡识别任务中的有效性。

2.3.2 DLDNet消融实验

为探究ConvNeXt特征提取网络、DFPN特征融合模块、CBAM注意力模块以及改进的CBAM对滑坡识别模型的影响,同样以基于ResNet-101特征提取网络和FPN结构的Mask R-CNN模型作为基线模型进行DLDNet模型消融实验。消融实验结果如表2所示,其中DCN表示可变形卷积。典型检测结果图对比如表3所示,其中红色为滑坡边界框识别结果,绿色为滑坡分割结果。

表2   DLDNet消融实验精度

Tab.2  Ablation experiments results of DLDNet (%)

序号ConvNeXtDFPNCBAMDCN边界框精度分割精度
APAP50AP75APAP50AP75
实验1××××46.583.252.341.881.442.5
实验4×××54.690.262.849.789.453.0
实验5××55.890.764.950.590.154.5
实验6×56.291.065.151.390.455.1
实验756.991.965.252.591.156.8

新窗口打开| 下载CSV


表3   DLDNet消融试验滑坡检测结果

Tab.3  Landslide detection results of DLDNet ablation experiment

序号真实值实验1实验4实验5实验6实验7
a
b
c
d
e

新窗口打开| 下载CSV


表2实验精度可以看出ConvNeXt特征提取网络、DFPN特征融合模块以及注意力模块都能在不同程度提升滑坡识别模型的识别精度。其中采用ConvNeXt网络时边界框和分割AP分别提升了8.1和7.9百分点,添加DFPN特征融合模块后边界框和分割AP分别进一步提升了1.2和0.8百分点,引入使用可变形卷积改进空间注意力的CBAM模块时边界框和分割AP分别又提升了1.1和2.0百分点。最终DLDNet识别模型的边界框和分割AP分别达到最高的56.9%和52.5%,较基线模型提升了10.4和10.7百分点,并且边界框和分割AP50分别达到了91.9%和91.1%,AP75分别达到了65.2%和56.8%,大幅提升了滑坡检测精度。

表3滑坡检测结果对比可以看出,改进的滑坡检测算法在整体上表现出更出色的性能,取得最为准确的边界框和分割检测结果(如表3中a行);在其他相似地物干扰的复杂环境下进行滑坡识别时,原模型会将背景误判为识别目标,识别结果均出现了不同程度的误判(如表3中b和c行),这是因为背景信息与滑坡的特征较为相似从而导致误识别;在面对有植被覆盖的滑坡以及小样本滑坡时(如表3中d和e行),DLDNet模型同样具备更强的检测能力,因为改进的滑坡识别模型能够更加聚焦滑坡信息从而提高检测精度。

2.4 综合对比试验

为验证DLDNet在遥感影像滑坡识别任务中的性能,在遥感滑坡数据集上与经典及先进的检测模型进行对比,包括Faster R-CNN,Cascade Mask R-CNN,Dynamic R-CNN与RTMDet方法,其中Faster R-CNN模型ROI层使用感兴趣区域对齐模块。为了对比的公平性,每种算法除了其专门参数沿用原文之外,学习率、批大小与epoches等超参设置均与上文相同,实验结果如表4所示。典型检测结果图对比如表5所示。

表4   不同模型实验结果

Tab.4  Experimental results of different models (%)

序号方法主干网络边界框精度分割精度
APAP50AP75APAP50AP75
实验7DLDNetConvNeXt-T+改进CBAM+DFPN56.991.965.252.591.156.8
实验8Faster R-CNNResNet101+FPN46.885.849.1
实验9Dynamic R-CNNResNet101+FPN50.388.655.5
实验10Cascade Mask R-CNNResNet101+FPN50.086.555.144.583.045.2
实验11RTMDetCSPNeXt-T+PAFPN56.891.864.051.289.054.6

新窗口打开| 下载CSV


表5   不同模型滑坡检测结果

Tab.5  Landslide detection results of different models

序号真实值实验7实验8实验9实验10实验11
a
b
c
d

新窗口打开| 下载CSV


由实验结果可以看出本文提出的DLDNet算法取得了最高的检测精度,其边界框和分割AP分别达到了最高的56.9%和52.5%。与Faster R-CNN和Dynamic R-CNN目标检测模型相比,边界框AP分别提升了10.1和6.6百分点,显著地提高了滑坡识别的精度。与Cascade Mask R-CNN和RTMDet实例分割模型相比,在识别任务与在分割任务中都实现了精度的提升。其中边界框AP分别提升了6.9和0.1百分点,分割AP分别提升了8.0和1.3百分点,且边界框和分割AP50AP75也均为对比实验最高精度。通过对比不同检测模型的实验结果,证明了本文方法在滑坡识别任务中的优越性。

表5检测结果可以看出,Faster R-CNN与Dynamic R-CNN模型在进行检测时出现了许多误识别现象(如表5中a,b和d行),并且这2个算法只有边界框定位功能,不能提供精确的滑坡形状信息以满足应急救援工作的需要。Cascade Mask R-CNN与RTMDet是2个实例分割模型,能够同时获取预测边界框和掩模,但滑坡检测的精度不及本文模型,依旧存在误识别(如表5中a和d行)和分割精度不足(如表5中c行)等现象。通过对比不同算法的滑坡检测结果可以看出,本文的滑坡识别模型在复杂环境下拥有最好的滑坡识别表现。

综上所述,通过不同算法的对比试验结果与滑坡检测结果可知,DLDNet在完成复杂环境的滑坡识别工作时,能够充分提取遥感影像中的特征信息,并且更加聚焦滑坡信息,能够有效地区分滑坡与背景信息,具有较强的鲁棒性和准确性,能够更好地完成复杂环境下的滑坡识别任务。

3 结论

针对遥感影像滑坡监测工作中存在很多误识别现象的问题,设计了一种DLDNet滑坡检测网络,以南景滑坡数据和毕节滑坡数据作为数据源进行了实验与分析。首先使用数据增强方法模拟复杂环境下的滑坡样本以提升模型的鲁棒性和泛化能力;采用ConvNeXt作为特征提取网络,弥补了传统特征提取网络提取能力不足的缺陷;使用改进空间注意力的CBAM模块聚焦滑坡信息,从而提高检测精度;提出一种多尺度特征融合网络DFPN,其能够在丰富感受野的同时对多尺度特征进行二次融合。

参考文献

铁永波, 葛华, 高延超, .

二十世纪以来西南地区地质灾害研究历程与展望

[J]. 沉积与特提斯地质, 2022, 42(4):653-665.

[本文引用: 1]

Tie Y B, Ge H, Gao Y C, et al.

The research progress and prospect of geological hazards in Southwest China since the 20th Century

[J]. Sedimentary Geology and Tethyan Geology, 2022, 42(4):653-665.

[本文引用: 1]

蔡建澳, 明冬萍, 赵文祎, .

基于综合遥感的察隅县滑坡隐患识别及致灾机理分析

[J]. 自然资源遥感, 2024, 36(1):128-136.doi:10.6046/zrzyyg.2023313.

[本文引用: 1]

Cai J A, Ming D P, Zhao W Y, et al.

Integrated remote sensing-based hazard identification and disaster-causing mechanisms of landslides in Zayu County

[J]. Remote Sensing for Natural Resources, 2024, 36(1):128-136.doi:10.6046/zrzyyg.2023313.

[本文引用: 1]

晏同珍, 杨顺安, 方云. 滑坡学[M]. 武汉: 中国地质大学出版社, 2000.

[本文引用: 1]

Yan T Z, Yang S A, Fang Y. Landslidologies[M]. Wuhan: China University of Geosciences Press, 2000.

[本文引用: 1]

Fan J R, Zhang X Y, Su F H, et al.

Geometrical feature analysis and disaster assessment of the Xinmo landslide based on remote sensing data

[J]. Journal of Mountain Science, 2017, 14(9):1677-1688.

[本文引用: 1]

李强, 张景发, 罗毅, .

2017年“8.8”九寨沟地震滑坡自动识别与空间分布特征

[J]. 遥感学报, 2019, 23(4):785-795.

[本文引用: 1]

Li Q, Zhang J F, Luo Y, et al.

Recognition of earthquake-induced landslide and spatial distribution patterns triggered by the Jiuzhaigou earthquake in August 8,2017

[J]. Journal of Remote Sensing, 2019, 23(4):785-795.

[本文引用: 1]

Sato H P, Hasegawa H, Fujiwara S, et al.

Interpretation of landslide distribution triggered by the 2005 Northern Pakistan earthquake using SPOT 5 imagery

[J]. Landslides, 2007, 4(2):113-122.

[本文引用: 1]

Lu P, Qin Y, Li Z, et al.

Landslide mapping from multi-sensor data through improved change detection-based Markov random field

[J]. Remote Sensing of Environment, 2019, 231:111235.

[本文引用: 1]

李晨辉, 郝利娜, 许强, .

面向对象的高分辨率遥感影像地震滑坡分层识别

[J]. 自然资源遥感, 2023, 35(1):74-80.doi:10.6046/zrzyyg.2022013.

[本文引用: 1]

Li C H, Hao L N, Xu Q, et al.

Object-oriented hierarchical identification of earthquake-induced landslides based on high-resolution remote sensing images

[J]. Remote Sensing for Natural Resources, 2023, 35(1):74-80.doi:10.6046/zrzyyg.2022013.

[本文引用: 1]

李麒崙, 张万昌, 易亚宁.

地震滑坡信息提取方法研究——以2017年九寨沟地震为例

[J]. 中国科学院大学学报, 2020, 37(1):93-102.

DOI:10.7523/j.issn.2095-6134.2020.01.011     

地震滑坡是最为常见且破坏力最强的地震地质次生灾害之一,快速准确地获取地震滑坡的分布和范围信息对震后应急救援和灾后重建工作具有重要意义。采用Sentinel-2A遥感影像,以"8·8九寨沟地震"核心震区——漳扎镇为研究区,通过结合变化检测技术和面向对象方法提取地震滑坡信息,利用改进的区域生长算法对提取的滑坡边界进行优化得到最终提取结果。通过与传统CVA提取结果对比,评价分析本文算法的精度。实验验证结果表明,本文算法的地震滑坡体提取总精度在90%以上,Kappa系数优于0.7,提取结果与目视解译结果较为一致。且自动化程度较高,速度较快,满足地震应急救援的时间和精度需求。

Li Q L, Zhang W C, Yi Y N.

An information extraction method of earthquake-induced landslide:A case study of the Jiuzhaigou earthquake in 2017

[J]. Journal of University of Chinese Academy of Sciences, 2020, 37(1):93-102.

张雨, 明冬萍, 赵文祎, .

基于高分光学卫星影像的泸定地震型滑坡提取与分析

[J]. 自然资源遥感, 2023, 35(1):161-170.doi:10.6046/zrzyyg.2022434.

[本文引用: 1]

Zhang Y, Ming D P, Zhao W Y, et al.

The extraction and analysis of Luding earthquake-induced landslide based on high-resolution optical satellite images

[J]. Remote Sensing for Natural Resources, 2023, 35(1):161-170.doi:10.6046/zrzyyg.2022434.

[本文引用: 1]

Liang R, Dai K, Shi X, et al.

Automated mapping of ms 7.0 Jiu-zhaigou earthquake (China) post-disaster landslides based on high-resolution UAV imagery

[J]. Remote Sensing, 2021, 13(7):1330.

[本文引用: 1]

郭澳庆, 胡俊, 郑万基, .

时序InSAR滑坡形变监测与预测的N-BEATS深度学习法——以新铺滑坡为例

[J]. 测绘学报, 2022, 51(10):2171-2182.

DOI:10.11947/j.AGCS.2022.20220298      [本文引用: 1]

滑坡通常发生突然,破坏力巨大,经常造成重大生命安全事故和财产损失。高可靠性、高精度及具有抗差性能的滑坡形变监测预测手段和方法对于国家防灾减灾需求具有切实意义。InSAR技术是一种能够全天时和全天候观测获取高空间分辨率和宽覆盖率影像,高灵敏性捕捉时空维动态变化的监测手段,然而目前应用InSAR时序影像对滑坡区进行滑坡预测的工作仅是凤毛麟角。基于时序InSAR观测结果,本文提出了一种能够有效解决中短期滑坡预测问题的深度学习滑坡预测方法。在三峡新铺滑坡区应用N-BEATS网络模型和Sentinel-1 SAR数据进行形变预测,以均方根误差1.1 mm的预测精度完成了滑坡预测工作,并对预测结果进行了数据结构影响的规律性分析、传统方法效果对比、抗差性评估及置信区间估计等多方位的剖析,结果显示出了其高精度、高可靠性及具有一定抗差能力的突出优势。

Guo A Q, Hu J, Zheng W J, et al.

N-BEATS deep learning method for landslide deformation monitoring and prediction based on InSAR:A case study of Xinpu landslide

[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(10):2171-2182.

[本文引用: 1]

姜万冬, 席江波, 李振洪, .

模拟困难样本的Mask R-CNN滑坡分割识别

[J]. 武汉大学学报(信息科学版), 2023, 48(12):1931-1942.

Jiang W D, Xi J B, Li Z H, et al.

Landslide detection and segmentation using Mask R-CNN with simulated hard samples

[J]. Geomatics and Information Science of Wuhan University, 2023, 48(12):1931-1942.

白石, 唐攀攀, 苗朝, .

基于高分辨率遥感影像和改进U-Net模型的滑坡提取——以汶川地区为例

[J]. 自然资源遥感, 2024, 36(3):96-107.doi:10.6046/zrzyyg.2023132.

[本文引用: 1]

Bai S, Tang P P, Miao Z, et al.

Information extraction of landslides based on high-resolution remote sensing images and an improved U-Net model:A case study of Wenchuan,Sichuan

[J]. Remote Sensing for Natural Resources, 2024, 36(3):96-107.doi:10.6046/zrzyyg.2023132.

[本文引用: 1]

Cortes C, Vapnik V.

Support-vector networks

[J]. Machine Lear-ning, 1995, 20(3):273-297.

[本文引用: 1]

Breiman L.

Random forests

[J]. Machine Learning, 2001, 45:5-32.

[本文引用: 1]

Khelifi L, Mignotte M.

Deep learning for change detection in remote sensing images:Comprehensive review and meta-analysis

[J]. IEEE Access, 2020, 8:126385-126400.

[本文引用: 1]

刘佳, 伍宇明, 高星, .

基于GEE和U-net模型的同震滑坡识别方法

[J]. 地球信息科学学报, 2022, 24(7):1275-1285.

DOI:10.12082/dqxxkx.2022.210704      [本文引用: 1]

地震滑坡解译是震后重建的重要基础工作,主要通过室内人工遥感解译和室外野外调查确定。地震滑坡相比其他地物来说更为复杂,很难通过简单指数识别。室内遥感解译通过滑坡后壁、侧壁和堆积等纹理特征进行识别,大面积同震滑坡解译工作往往耗费大量人力和物力,且耗时长,难以满足灾害应急需求。本研究利用U-net神经网络模型,结合Google Earth Engine(GEE)云平台和人工智能学习平台Tensorflow,以地震局解译的汶川滑坡作为样本数据,以震后30 m分辨率的Landsat影像、高程、坡度以及NDVI数据作为模型输入参数,自动识别并获取了汶川地震后的同震滑坡数据,同时比较了不同参数组合情况下U-net神经网络模型的分割识别精度。研究表明:① U-net模型可以用于以Landsat影像为基础数据的同震滑坡快速自动识别;② 随着高程、坡度以及NDVI等输入参数增加,模型分割精度在逐渐提高,但假阳性结果也会出现增多,震后滑坡影像+高程+坡度+NDVI的输入参数组合精度最高;③ 在细节上,模型在多参数组合的情况下,大型滑坡能够很好被识别,一些较小型的滑坡受制于影像分辨率的影响,分割精度较差。为了更好识别小型滑坡,后续研究可能需提高影像的分辨率。此外,GEE云平台大大提高了训练样本获取的效率,为科研人员快速进行基于神经网络与遥感数据的地物识别研究提供了条件。

Liu J, Wu Y M, Gao X, et al.

Image recognition of co-seismic landslide based on GEE and U-net neural network

[J]. Journal of Geo-Information Science, 2022, 24(7):1275-1285.

[本文引用: 1]

杨昭颖, 韩灵怡, 郑向向, .

基于卷积神经网络的遥感影像及DEM滑坡识别——以黄土滑坡为例

[J]. 自然资源遥感, 2022, 34(2):224-230.doi:10.6046/zrzyyg.2021204.

[本文引用: 1]

Yang Z Y, Han L Y, Zheng X X, et al.

Landslide identification using remote sensing images and DEM based on convolutional neural network:A case study of loess landslide

[J]. Remote Sensing for Natural Resources, 2022, 34(2):224-230.doi:10.6046/zrzyyg.2021204.

[本文引用: 1]

Yu Z, Chang R, Chen Z.

Automatic detection method for loess landslides based on GEE and an improved YOLOX algorithm

[J]. Remote Sensing, 2022, 14(18):4599.

[本文引用: 1]

Yang R, Zhang F, Xia J, et al.

Landslide extraction using mask R-CNN with background-enhancement method

[J]. Remote Sensing, 2022, 14(9):2206.

[本文引用: 1]

唐小川, 涂子涵, 任绪清, .

一种识别植被覆盖滑坡的多模态深度神经网络模型

[J]. 武汉大学学报(信息科学版), 2024, 49(9):1566-1573.

[本文引用: 1]

Tang X C, Tu Z H, Ren X Q, et al.

A multi-modal deep neural network model for forested landslide detection

[J]. Geomatics and Information Science of Wuhan University, 2024, 49(9):1566-1573.

[本文引用: 1]

蒋伟杰, 张春菊, 徐兵, .

AED-Net:滑坡灾害遥感影像语义分割模型

[J]. 地球信息科学学报, 2023, 25(10):2012-2025.

DOI:10.12082/dqxxkx.2023.230171      [本文引用: 1]

遥感影像蕴含丰富的语义信息,在滑坡灾害监测任务中发挥出了重要的作用。传统的滑坡识别主要通过遥感目视解译和人机交互识别,存在耗时费力、主观性强和提取精度低等问题。语义分割作为深度学习中的一项重要任务,因其端到端的像素级分类能力,已在遥感影像自动化识别任务中发挥出了重要作用。现有遥感影像滑坡灾害语义分割模型通常无法顾及多尺度地物特征,且随着网络深度增加会造成边界模糊等问题。本文提出了AED-Net(Attention combined with Encoder-Decoder Network),使用浅层特征提取网络缓解深度神经网络造成的边界模糊问题,利用空洞空间卷积池化金字塔结构的多尺度特征提取能力,结合编码器-解码器结构的特征还原能力还原边界信息,并使用通道注意力机制强化模型的关键特征学习能力。利用GID-5数据集针对模型中空洞卷积的膨胀率设置、通道注意力机制的选择进行对比试验以得到最优解,最终得到的模型在毕节市滑坡灾害数据集上获得了最优表现,像素准确度为95.58%,平均像素精度为89.24%,平均交互比为82.68%,相比PSP-Net、Attention U-Net、加入ECA注意力机制的DeeplabV3+、PA-Fov、LandsNet等语义分割模型,PA提升了0.73%~1.97%,MPA提升了1.0%~2.84%,MIoU提升了2.25%~5.11%,达到了最优分割效果。

Jiang W J, Zhang C J, Xu B, et al.

AED-net:Semantic segmentation model for landslide recognition from remote sensing images

[J]. Journal of Geo-Information Science, 2023, 25(10):2012-2025.

[本文引用: 1]

Ji S, Yu D, Shen C, et al.

Landslide detection from an open satellite imagery and digital elevation model dataset using attention boosted convolutional neural networks

[J]. Landslides, 2020, 17(6):1337-1352.

[本文引用: 2]

He K, Gkioxari G, Dollár P, et al. Mask R-CNN[C]//2017 IEEE International Conference on Computer Vision (ICCV). IEEE, 2017:2980-2988.

[本文引用: 1]

Woo S, Park J, Lee J Y, et al. CBAM:Convolutional block attention module[M]//Lecture Notes in Computer Science. Cham: Springer International Publishing,2018:3-19.

[本文引用: 1]

Liu Z, Mao H, Wu C Y, et al. A ConvNet for the 2020s[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2022:11966-11976.

[本文引用: 1]

付国栋, 黄进, 杨涛, .

改进CBAM的轻量级注意力模型

[J]. 计算机工程与应用, 2021, 57(20):150-156.

DOI:10.3778/j.issn.1002-8331.2101-0369      [本文引用: 1]

近几年注意力模型在计算机视觉领域取得了广泛的应用,通过在卷积神经网络中加入注意力模型,网络的性能可以显著提升。然而大多数现有的方法都专注于开发更复杂的注意力模型,以使卷积神经网络获得更强的特征表达能力,但这也不可避免地增加了模型的复杂性。为了在性能和复杂度间取得平衡,对CBAM模型进行优化提出了轻量级的EAM(Efficient Attention Module)模型。针对CBAM的通道注意力模块,引入一维卷积替代全连接层来聚合各通道间的信息;对于CBAM的空间注意力模块,将大卷积核替换为空洞卷积来增加感受野以聚合更广的空间上下文信息。将该模型融入YOLOv4后在VOC2012数据集上进行测试,mAP提高3.48个百分点。实验结果表明,该注意力模型只引入较小的参数量,网络性能可获得较大提升。

Fu G D, Huang J, Yang T, et al.

Improved lightweight attention model based on CBAM

[J]. Computer Engineering and Applications, 2021, 57(20):150-156.

DOI:10.3778/j.issn.1002-8331.2101-0369      [本文引用: 1]

In recent years, the attention model has been widely used in the field of computer vision. By adding the attention module to the convolutional neural network, the performance of the network can be significantly improved. However, most of the existing methods focus on the development of more complex attention modules to enable the convolutional neural network to obtain stronger feature expression capabilities, but this also inevitably increases the complexity of the model. In order to achieve a balance between performance and complexity, a lightweight EAM(Efficient Attention Module) model is proposed to optimize the CBAM model. For the channel attention module of CBAM, one-dimensional convolution is introduced to replace the fully connected layer to aggregate the channels. For the spatial attention module of CBAM, the large convolution kernel is replaced with a dilated convolution to increase the receptive field for aggregation Broader spatial context information. After integrating the model into YOLOv4 and testing it on the VOC2012 data set, mAP is increased by 3.48 percentage points. Experimental results show that the attention model only introduces a small amount of parameters, and the network performance can be greatly improved.

Lin T Y, Dollár P, Girshick R, et al. Feature pyramid networks for object detection[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2017:936-944.

[本文引用: 1]

Cao J, Chen Q, Guo J, et al.

Attention-guided context feature pyramid network for object detection

[J/OL]. arXiv, 2020:2005.11475. https://arxiv.org/abs/2005.11475v1.

URL     [本文引用: 1]

Yun S, Han D, Chun S, et al. CutMix:Regularization strategy to train strong classifiers with localizable features[C]//2019 IEEE/CVF International Conference on Computer Vision (ICCV). IEEE, 2019:6022-6031.

[本文引用: 1]

Bochkovskiy A, Wang C Y, Liao H Y M. YOLOv4:Optimal speed and accuracy of object detection[J/OL]. arXiv, 2020:2004.10934. https://arxiv.org/abs/2004.10934v1.

URL     [本文引用: 1]

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发