基于卷积神经网络的遥感影像及DEM滑坡识别——以黄土滑坡为例
Landslide identification using remote sensing images and DEM based on convolutional neural network: A case study of loess landslide
通讯作者: 韩灵怡(1990-),女,博士,工程师,研究方向为通讯工程与人工智能。Email:hanlingyi@mail.cgs.gov.cn。
责任编辑: 张仙
收稿日期: 2021-06-30 修回日期: 2021-12-28
基金资助: |
|
Received: 2021-06-30 Revised: 2021-12-28
作者简介 About authors
杨昭颖(1992-),女,硕士,工程师,研究方向为数据挖掘与人工智能。Email:
我国是滑坡灾害频发的国家之一,近年来发生的灾难性地质灾害事件有70%以上都不在已知的地质灾害隐患点范围内,亟须通过自动高效的滑坡识别技术方法开展大规模滑坡灾害排查。为了从海量遥感影像中快速识别滑坡的位置,确定滑坡重点区,支撑后续的解译与研究,以黄土滑坡为例,基于GF-1影像与数字高程模型(digital elevation model,DEM) 数据开展滑坡识别研究。首先构建了遥感影像和DEM滑坡样本库,然后应用通道融合卷积神经网络模型对滑坡样本进行分类,最后将分类结果按照位置信息还原到遥感影像图中。实验结果表明模型的滑坡识别精度可达95.7%,召回率为100.0%。研究所用模型的网络层数较少,收敛速度快,具有更高的效率与识别精度,解决了在样本有限的情况下,从遥感影像中快速确定滑坡重点区的问题,以支撑大规模滑坡灾害排查。
关键词:
China is one of the countries with frequent landslide disasters. In recent years. In recent years, more than 70% of the catastrophic geological hazards have occurred not within the scope of known hidden danger points of geological hazards in China. Therefore, there is an urgent need for investigating large-scale landslide disasters using automatic and efficient technologies and methods for landslide identification. To quickly identify the location of landslides from massive remote sensing images, it is necessary to determine the key areas of landslides to support subsequent interpretation and research. This study investigated loess landslide identification based on GF-1 images and digital elevation model (DEM) data. First, a database of remote sensing images and DEM landslide samples was constructed. Second, the landslide samples were classified using the channel fusion convolutional neural network model. Finally, the classification results were restored to the remote sensing images according to the location information. Experimental results showed that the model yielded landslide identification accuracy of 95.7% and a recall rate of 100.0%. The model used in this study has a small number of network layers, a high convergence speed, and higher efficiency and identification accuracy. As a result, it allows for the quick identification of key landslide areas from remote sensing images in the case of a limited number of samples, thus supporting the investigation of large-scale landslide disasters.
Keywords:
本文引用格式
杨昭颖, 韩灵怡, 郑向向, 李文吉, 冯磊, 王轶, 杨永鹏.
YANG Zhaoying, HAN Lingyi, ZHENG Xiangxiang, LI Wenji, FENG Lei, WANG Yi, YANG Yongpeng.
0 引言
我国是滑坡灾害频发的国家之一,每年由滑坡造成的人员伤亡和财产损失极为严重。从20世纪90年代起,国家先后开展了系统全面的地质灾害人工排查和群测群防。但是近年来发生的灾难性地质灾害事件有70%以上都不在已知的地质灾害隐患点范围内[1],亟须通过自动、高效的滑坡识别技术方法开展面向全国范围的大规模地质灾害排查。随着对地观测技术的迅猛发展,遥感技术在大范围地质灾害调查中的应用也越来越普遍。从大量的遥感数据中快速、全面和准确地识别出滑坡对防灾减灾具有重要意义。
利用遥感技术识别滑坡先后经历了目视解译、基于像元的提取方法、面向对象的提取方法以及基于深度学习的提取方法4个阶段。目视解译的准确性一般比较高,但是比较依赖专家的知识和经验,且主观性强,费时费力,难以满足大范围的遥感影像快速解译滑坡的需求。基于像元的滑坡提取方法是以像元为分析单元,基于某些算法模型,从遥感影像中自动地提取出滑坡,速度快,也能保证一定的精度[2],但是基于像元的滑坡提取方法只能在同一分辨率基础上处理所有地物信息,而且不能充分利用影像中丰富的结构、纹理等信息,造成信息浪费,提取结果也存在“椒盐现象”,空间不连续[3]。面向对象的信息提取方法最重要的特点是其处理的单元是单个对象,不再是单个像元,同时能在一定程度上模拟人脑对事物的认知过程,把具有相同特征的对象分为同一类,该方法能够有效避免“椒盐现象”,提高识别精度。周志华等[4]采用面向对象的方法,用eCognition软件对实验数据进行了分割,通过分析对象在影像上的植被指数、纹理、水体指数等规则特征,实现了滑坡体对象的分类提取; 丁辉等[5]采用面向对象的分类方法,基于波段选择、尺度分析,利用影像分割,结合光谱特征、空间特征和地貌特征进行区域黄土滑坡识别,得出滑坡后壁比滑坡体更易于识别的结论。
近年来,越来越多的学者开始关注于基于深度学习的滑坡识别研究。Ye等[6]提出具有约束条件的深度学习模型,应用到高光谱图像滑坡检测中,并将结果与支持向量机、光谱信息散度、光谱角度匹配方法做比较,得出深度学习提取高级特征对于滑坡检测的精度提升具有巨大潜力的结论; Ghorbanzadeh等[7]基于光学遥感和数字高程模型(digital elevation model,DEM)数据,比较了卷积神经网络、神经网络、支持向量机和随机森林方法在尼泊尔Rasuwa地区滑坡提取中的效果,得出尽管卷积神经网络的结果只比其他方法略占优势,但是如果存在足够的样本,卷积神经网络的提升空间将会比较大的结论; Wang等[8]使用集成的地理数据库,对比了卷积神经网络、随机森林、逻辑回归、强化学习、支持向量机5种机器学习方法在识别自然地形滑坡时的识别精度,在5种方法中,卷积神经网络的识别精度最高,同时指出基于机器学习和深度学习的识别技术在滑坡识别研究中具有出色的鲁棒性和解决问题的巨大潜力; 巨袁臻等[9]利用Mask R-CNN掩模区域卷积神经网络目标检测模块进行黄土滑坡自动识别,准确率虽然尚未达到60%,但是证实了Mask R-CNN模型在黄土滑坡识别中的可行性; Ji等[10]使用注意力增强卷积神经网络从开放的卫星图像和DEM数据集识别滑坡,得出注意力机制和DEM数据能够有效提升滑坡识别精度的结论; Yu等[11]基于Landsat影像,构建了端到端的滑坡检测深度学习框架,并对2015年尼泊尔的滑坡进行检测,结果表明该框架的准确度比类似研究高出44%,有可能适用于国家级的滑坡检测; Ullo等[12]基于无人机影像数据,利用Mask R-CNN和迁移学习算法进行山体滑坡检测,结果表明该方法在算法性能和稳健性方面均优于现有研究; Cheng等[13]在YOLOv4模型的基础上提出了一种新的YOLO-SA滑坡检测模型,对中国云南省乔家县和鲁甸县进行滑坡检测,并与11种现有的目标检测模型进行比较,结果表明YOLO-SA模型在参数数量、检测精度和运行速度方面均有所提升,并且可有效用于潜在滑坡检测; Catani[14]提出了一种新的深度学习分类器LanDLC,用于自动识别非标准图片中的滑坡和大规模位移,结果表明,该方法的平均准确率可达87%~90%,并且始终高于现有常用的卷积神经网络算法; Hacıefendio
在已有的使用深度学习进行滑坡识别的研究中,对于老滑坡的识别难度要高于对新滑坡的识别,新滑坡和老滑坡的划分标准主要以发生的时间为主,老滑坡的发生时间比较久远,容易被环境改变原有的特征; 新滑坡的发生时间与被发现的时间往往比较接近,例如植被覆盖较为丰富的西南地区,老滑坡很容易被植被覆盖而难以判断,而新滑坡则因为表面裸土未被植被覆盖而容易识别,因此西南地区主要以研究新滑坡为主,对老滑坡的研究还少之又少。相比于西南地区,黄土高原地区因植被覆盖相对较少,滑坡形态特征典型,边界轮廓清晰,老滑坡相对容易识别[5]。在现有研究中,滑坡识别模型往往较为复杂,特别是在样本有限的情况下,识别精度不高,且泛化能力有限,其原因可能是滑坡识别中需兼顾滑坡的位置与范围。本研究以黄土滑坡为例,基于高分一号(GF-1)影像与DEM数据开展滑坡识别研究,使用卷积神经网络对融合后的数据进行分类,从而实现滑坡的快速识别。以期从海量遥感影像中快速识别滑坡的位置,用于滑坡重点区的确定,支撑后续的解译与研究。
1 研究区概况与数据源
研究区选取了甘肃省东南部的静宁县、庄浪县和张家川回族自治县(简称张家川县)3个县,总面积约5 058 km2。研究区地处黄土高原丘陵沟壑区,地理位置接壤,地貌类型主要为侵蚀构造低山丘陵、剥蚀堆积黄土丘陵、侵蚀堆积河谷平原等。滑坡特征以低速蠕滑为主,高速滑动较少。收集灾害领域专家结合遥感影像和DEM数据对研究区滑坡灾害进行解译,得到老滑坡320处,其中滑坡面积最大为1 261 620 m2,最小为4 989 m2,平均为122 658 m2。滑坡的分布情况如图1所示。图1中底图为GF-1B3(R),B2(G),B1(B)合成影像。在这些解译的老滑坡中,主要有未改造老滑坡和已改造老滑坡之分。未改造老滑坡基本具备滑坡的主要特征,如滑坡后壁、侧壁、前缘堆积等,识别难度相对较小。已改造老滑坡又分为自然改造和人为改造,自然改造主要为降雨、风化、植被覆盖等自然因素,变化相对缓慢,往往能够保留老滑坡的大部分特征; 人为改造对老滑坡的影响往往较大,比如将老滑坡改造为梯田,或者在滑坡体上建造房屋、道路等,会使老滑坡边缘模糊,甚至会与周围环境融为一体,在滑坡解译过程中影响滑坡边界的界定,甚至无法分辨出滑坡的特征。图2为典型滑坡的示例,(a)为未改造老滑坡,(b)为已改造老滑坡,图中可见老滑坡被改造为梯田,(c)为已改造为梯田和房屋的老滑坡,(d)为已改造老滑坡,滑坡前缘部分被改造为道路。
图1
图2
2 数据处理与方法
2.1 数据处理
数据处理主要解决样本制作和样本增广问题。制作样本的数据源采用2 m空间分辨率的GF-1影像和30 m空间分辨率的DEM数据,标签部分用收集到的专家解译矢量数据进行标注。为了使遥感影像与DEM数据在空间上能够匹配,首先对DEM数据进行重采样,重采样后的DEM数据空间分辨率为2 m。通过分析所有滑坡外接矩形的长和宽,得出将滑坡样本的大小设为512像素×512像素最为合适。对重采样后的DEM和遥感影像以相同的方式进行裁切,将裁切后的图像分为有滑坡和无滑坡2类,有滑坡的图像为正样本,用1表示; 无滑坡的图像为负样本,用0表示。
正样本的裁切方式分为以滑坡为中心、滑坡在左上角、左下角、右上角、右下角5种策略,主要是因为背景对滑坡的识别有重要的影响,在背景和滑坡区分度不大的情况下,如果只是采用中心裁切,模型很可能会学到滑坡的位置特征,即滑坡在图像中心的规律,这并不是真正想要的滑坡的特征。此外,这也是一种有效的解决样本有限的方法,能够扩充正样本的数据规模。
负样本的裁切方式比较简单,理论上可以认为除了正样本分布的区域,其他区域都是负样本。但是由于滑坡解译具有人为主观性,在解译的过程中,可能会有一些滑坡被漏掉,而且负样本的数量远远超过正样本的数量,因此,制作负样本时,在剔除滑坡的部分,将影像裁切为512像素×512像素大小的图像,选取与正样本数量均衡的负样本。对于每一张图像,人工挑选没有滑坡发育的图像纳入负样本。DEM样本制作与影像样本制作一致,每一张影像对应相同位置的DEM数据。最终生成的样本由裁切后的影像图像、DEM数据和标签构成,一共形成2 154个样本。
2.2 研究方法
从样本制作的方式可以看出,本文将滑坡识别问题定义为分类问题,即只判断每张图像上是否存在滑坡,无需确定滑坡在图像上的具体位置及范围,这样可以在海量遥感影像中快速地确定滑坡重点区,缩小人工解译滑坡的范围,提升滑坡识别的精度和效率。
本文识别滑坡主要采用卷积神经网络的方法。卷积神经网络是一种解决图像分类问题的方法,由输入层、卷积层、池化层和全连接层组成。在经过多次调整网络结构并实验验证后,综合考虑训练精度与学习效率,设计了如图3所示的模型结构。
图3
卷积层采用
式中:
池化层采用最大输出方式,滑动窗口大小为
式中:
由于样本包含遥感图像和DEM数据,因此在输入卷积神经网络进行训练前,首先对两种数据源做通道融合处理。由于DEM为单通道数据,
式中:
遥感图像在
式中:
将测试数据输入到训练好的卷积神经网络模型后,得到每张图像的预测类别及概率,预测类别为每张图像是否存在滑坡,概率为每张图像所在区域存在滑坡的概率。将预测为1的图像按照图像自带的地理坐标叠加到影像底图中,并对预测区域用高亮显示,即可得到预测的滑坡重点区。
3 实验与分析
表1 训练与测试样本统计信息表
Tab.1
实验划分 | 样本组成 | 正样本 数量 | 负样本 数量 | 样本 总数 |
---|---|---|---|---|
实验一训练 | 静宁县+张家川县 | 608 | 626 | 1 234 |
实验二训练 | 静宁县+张家川县+庄浪县训练部分 | 798 | 818 | 1 616 |
测试 | 庄浪县测试部分 | 155 | 383 | 538 |
图4
图5
利用准确率(Accuracy)、精度(Precision)、召回率(Recall)、F1指标评价定量实验结果。各项指标计算方法如下:
式中: TP为当标签为正样本时分类为正样本的数目; FN为标签为正样本时分类为负样本的数目; FP为当标签为负样本时分类为正样本的数目; TN为当标签为负样本时分类为负样本的数目。
表2 实验一与实验二的测试结果
Tab.2
实验 | TP | FP | FN | TN | 正确 率/% | 精度/ % | 召回 率/% | F1/ % |
---|---|---|---|---|---|---|---|---|
实验一 | 155 | 17 | 0 | 366 | 96.8 | 90.1 | 100.0 | 94.8 |
实验二 | 155 | 7 | 0 | 376 | 98.7 | 95.7 | 100.0 | 97.8 |
图6
实验二的测试结果要优于实验一的测试结果,表现在准确率、精度和F1均有所提升,主要因为实验二中FP(即0判断为1)的值有所下降,这说明加入了部分庄浪县的样本参与模型的训练,一方面样本量增加对于模型精度的提升有帮助,另一方面增加部分具有同测试区相同特点的样本,对于模型的泛化能力有提升,因此从整体上看,降低了负样本的误判。但是两次实验并没有提升TP(1判断为1)的值,所以两次实验的召回率是一样的。至于召回率在保证测试数据没有参加过训练的情况下,经过多次实验验证,确实能达到100%。分析原因可能是因为模型在决策时倾向于将测试样本判断为1,再通过一次次迭代逐渐将预测为1的数量减少,因此出现了一些0判断为1的情况。
4 结论
本文以黄土滑坡为例,基于GF-1影像与DEM数据开展滑坡识别研究,构建了研究区黄土滑坡遥感影像与DEM分类样本库; 应用通道融合卷积神经网络模型对滑坡样本进行分类,实验结果表明模型的识别精度为95.7%,召回率达到100%。本文所用模型的网络层数较少,能够快速收敛,具有更高的效率与提取精度,解决了在样本有限的情况下,从遥感影像中快速确定滑坡重点区的问题,对大规模滑坡灾害排查提供了技术支撑。
在实验过程中发现,由于研究区内滑坡数量有限,因此扩大实验规模需要增加研究区域的范围,而研究区域越大,滑坡的特征就会更多样化,对于滑坡的提取也会越困难。因此,对滑坡的识别是一个渐进的过程,通过小规模研究区域的训练样本,训练出识别模型,对邻近的区域进行滑坡识别,在后续的工作中,新识别出的样本将继续加入到模型中继续优化,逐步积累样本,优化模型,不断扩大研究区域,直至扩展到整个黄土区。此外,还应从进一步增加训练样本类型提升模型的泛化能力,对大规模滑坡快速自动识别具有重要意义。
志谢
感谢童立强、郭兆成、王珊珊等地质灾害调查监测团队成员提供的滑坡解译数据,为本文研究提供了数据支撑。感谢林雪敏为本文制图提供的建议和帮助。
参考文献
基于天-空-地一体化的重大地质灾害隐患早期识别与监测预警
[J].
Integrated space-air-ground early detection,monitoring and warning system for potential catastrophic geohazards
[J].
基于变化检测的滑坡灾害自动识别
[J].
Automatic recognition of landslides based on change detection
[J].
基于面向对象的滑坡快速识别技术研究
[J].
Research of fast landslide recognition based on object-oriented technology
[J].
黄土滑坡高分辨率遥感影像识别——以陕西省延安市地区为例
[J].
High resolution remote sensing for the identification if loess landslides:Example from Yan’an City
[J].
Landslide detection of hyperspectral remote sensing data based on deep learning with constrains
[J].DOI:10.1109/JSTARS.2019.2951725 URL [本文引用: 1]
Evaluation of different machine learning methods and deep-learning convolutional neural networks for landslide detection
[J].DOI:10.3390/rs11010001 URL [本文引用: 1]
Landslide identification using machine learning
[J].DOI:10.1016/j.gsf.2020.02.012 URL [本文引用: 1]
使用深度学习方法实现黄土滑坡自动识别
[J].
Automatic object detection of loess landslide based on deep learning
[J].
Landslide detection from an open satellite imagery and digital elevation model dataset using attention boosted convolutional neural networks
[J].
Landslide detection based on contour-based deep learning framework in case of national scale of Nepal in 2015
[J].DOI:10.1016/j.cageo.2019.104388 URL [本文引用: 1]
A new Mask R-CNN-based method for improved landslide detection
[J].DOI:10.1109/JSTARS.2021.3064981 URL [本文引用: 1]
A small attentional YOLO model for landslide detection from satellite remote sensing images
[J].DOI:10.1007/s10346-021-01694-6 URL [本文引用: 1]
Landslide detection by deep learning of non-nadiral and crowdsourced optical images
[J].DOI:10.1007/s10346-020-01513-4 URL [本文引用: 1]
Landslide detection using visualization techniques for deep convolutional neural network models
[J].DOI:10.1007/s11069-021-04838-y URL [本文引用: 1]
/
〈 |
|
〉 |
