遥感主流教学科研软件在复杂矿山场景土地利用分类中的对比研究
Comparative study of popular remote sensing teaching and research software for land use classification in a complex mine scene
通讯作者: 邢江河(1997-),男,博士研究生,主要从事矿区土地利用遥感识别等研究。Email:xingjh0929@163.com。
收稿日期: 2023-12-20 修回日期: 2024-02-29
基金资助: |
|
Received: 2023-12-20 Revised: 2024-02-29
作者简介 About authors
张成业(1991-),男,博士,副教授、博导,主要从事矿区生态遥感监测等研究。Email:
遥感图像处理软件的性能直接制约了相关工作者开展教学和科研活动的效果和效率。该文以复杂矿山场景土地利用分类为任务对象,对比研究了PIE,ENVI,ERDAS和eCognition等主流遥感软件以及分析了自研的深度学习算法的性能。结果表明: ①ENVI在常规方法面向像元分类时表现出最高的总体精度(overall accuracy,OA)和Kappa系数,但分类效率最低,相比之下,ERDAS在兼顾较高精度的条件下运行效率最高; ②eCognition在常规方法面向对象分类时取得了最优的OA和Kappa,也具备较高的运行效率; ③深度卷积神经网络算法相较于常规方法的分类结果具有明显的精度优势。文章定量地揭示了不同软件在不同策略方法上的性能表现,能够为相关工作者选择合适的图像处理软件、提升教学效果和科研效率提供科学依据。
关键词:
The performance of remote sensing image processing software directly influences the effectiveness and efficiency of teaching and research activities conducted by related workers. Focusing on land use classification in a complex mine scene, this study comparatively investigated the performance of popular remote sensing software including Pixel Information Expert (PIE), Environment for Visualizing Images (ENVI), ERDAS IMAGINE (ERDAS), and eCognition Developer (eCognition), and the self-developed deep learning algorithm. The results show that ENVI yielded the highest overall accuracy (OA) and Kappa coefficient but the lowest classification efficiency in conventional pixel-oriented classification. In contrast, ERDAS exhibited the highest operational efficiency while maintaining relatively high accuracy. eCognition achieved the optimal OA and Kappa coefficient and relatively high operational efficiency in conventional object-oriented classification. The deep convolutional neural network algorithm demonstrated superior accuracy over the classification results of conventional methods. Overall, this study quantitatively revealed the performance of various software on different strategies and methods, providing a scientific basis for related workers to choose appropriate image processing software and improve teaching effect and research efficiency.
Keywords:
本文引用格式
张成业, 李梦圆, 邢江河, 邱宇航.
ZHANG Chengye, LI Mengyuan, XING Jianghe, QIU Yuhang.
0 引言
遥感数字图像数据的获取、处理、应用是遥感技术实施的3个主要步骤,其中遥感数字图像处理是遥感技术过程的关键环节,其处理结果的优劣直接决定了能否满足行业领域的应用需求[1-2]。作为人才培养和科学研究的重要源头,过去几十年来高校遥感专业的教学和科研主要依赖国外版权的图像处理软件,如ENVI,ERDAS和eCognition等[3-
当前,一些学者对上述软件开展了一定的对比研究,也在矿山土地利用分类中开展了应用。陈蕊等[10]利用eCognition软件进行面向对象分类方法的研究,并与ENVI软件进行对比分析,结果表明基于面向对象分类方法的eCognition软件在城市场景土地利用分类研究中更具可靠性;王海芹等[11]对国外主流遥感软件的土地利用分类过程和结果进行分析,定性地阐述了各个软件的优缺点,但缺少实验数据支持;陈理等[12]利用eCognition软件对缅甸达贡山镍矿进行了2期的土地利用分类,并对矿山土地利用类型的动态变化进行了分析;邵亚琴等[13]利用ENVI软件在忻州窑矿开展了5期的土地利用类型分类,服务于矿山土地发展分析。虽然上述研究在土地利用分类方向上对不同遥感软件进行了对比和应用,但是仍然存在如下问题: ①缺少以实验数据验证的方式对PIE,ENVI,ERDAS和eCognition软件不同分类方法的全面对比; ②缺少上述软件在矿山土地利用遥感分类任务上的对比研究。
因此,本文以复杂矿山场景土地利用分类为任务对象,对比研究PIE,ENVI,ERDAS和eCognition等软件在不同分类策略(面向像元的分类策略和面向对象的分类策略)和不同分类方法(最小距离法、最大似然法、支持向量机、深度卷积神经网络)上的精度和效率,对比实验结果定量地揭示不同软件在不同策略方法上的性能表现,为相关工作者根据教学内容和科研需求选择恰当软件提供重要参考。
1 研究区概况与数据源
1.1 研究区概况
研究区位于内蒙古自治区鄂尔多斯市露天煤矿聚集区,经纬度范围为110°28'12″~ 110°36'05″E,39°25'56″~ 39°39'54″N,面积为81.35 km2,属于高山丘陵和沟壑地貌,地表侵蚀强烈,水土流失严重[14]。研究区涵盖西梁煤矿、来叶沟煤矿等8个露天煤矿,土地利用类型既包括矿山场景特色土地利用类型(如露天采场、排土场、复垦区等),也包括常规土地利用类型(如建筑、植被、裸地等)。研究区土地利用场景较为复杂,类内异质性大,类间边界区分难度大。
1.2 研究数据
图1
结合遥感影像数据和现场实地调查结果,本研究将研究区域分类为6种土地利用类型,包括露天采场、复垦区、排土场、建筑物、植被和裸地。本研究利用人工目视解译与野外调查相结合的方式构建样本集,构建过程中充分考虑样本在不同土地利用类型上的多样性和均衡性,降低样本因素对不同软件对比结果的影响。样本集共有2 262个样本,不同土地利用类型的样本数量如表1所示。
表1 不同土地利用类型的样本数量
Tab.1
土地利用类型 | 训练集样本 | 测试集样本 | 总计 |
---|---|---|---|
露天采场 | 331 | 116 | 447 |
排土场 | 218 | 108 | 326 |
复垦区 | 240 | 107 | 347 |
建筑 | 200 | 120 | 320 |
植被 | 344 | 175 | 519 |
裸地 | 201 | 102 | 303 |
总计 | 1 534 | 728 | 2 262 |
2 实验方法和设置
2.1 实验方法
1)最小距离法。最小距离法属于距离判断分类法中的典型代表方法[17]。该方法以待分类像元的特征值到各类别训练样本特征值的距离作为分类依据。本文具体实现过程为:首先,通过训练样本计算各类别的特征均值;然后,计算待分类像元的特征与各类别特征均值的欧氏距离;最后,将待分类像元归入到距离最小的类别中。
2)最大似然法。最大似然法是根据概率判别函数和贝叶斯判别规则进行分类的方法[18]。本文具体实现过程为:首先,定义一个归属于某个类别的概率分布集群;然后,计算待分类像元归属各类别的条件概率;最后,将待分类像元归入到条件概率最大的类别中。
3)支持向量机法。支持向量机法是一种基于统计学习理论的机器学习方法[19]。本文具体实现过程为:首先,利用核函数将样本特征映射到高维空间中;然后,在特征的高维空间中构建一个超平面,最大化各类样本特征到超平面的距离;最后,以构建的超平面为分类依据,对像元进行分类。
4)深度卷积神经网络法。神经网络是一种模拟人脑神经思维方式的数据模型,其目标是通过模拟人脑识别、记忆、思考的过程来实现遥感图像分类[20]。随着深度学习人工智能的迅速发展,卷积神经网络和全卷积神经网络成为遥感图像土地利用分类的热点方法。本研究分别采用PIE-Engine AI平台的全卷积神经网络Attention_UNet模型和笔者自研的基于面向对象的改进型密集连接卷积网络(object-oriented improved densely connected convolutional network,ODCC)进行面向像元和面向对象的矿山土地利用分类。ODCC模型的网络结构如图2所示,它采用面向对象的分类策略,并在原密集连接卷积网络的基础上融合了可变形卷积模块和卷积注意力模块(convolutional block attention module,CBAM)[21-
图2
2.2 实验设置
表2 面向像元分类的对比实验
Tab.2
面向像元 分类方法 | PIE- Basic | PIE- Engine AI | ENVI | ERDAS | eCognition |
---|---|---|---|---|---|
最小距离法 | √ | × | √ | √ | × |
最大似然法 | √ | × | √ | √ | × |
支持向量机法 | √ | × | √ | √ | × |
Attention_UNet | × | √ | × | × | × |
表3 面向对象分类的对比实验
Tab.3
面向对象 分类方法 | PIE-SIAS | ENVI | ERDAS | eCognition | Python+ PyCharm |
---|---|---|---|---|---|
最小距离法 | √ | √ | × | √ | × |
最大似然法 | √ | × | × | √ | × |
支持向量机法 | √ | √ | × | √ | × |
ODCC | × | × | × | × | √ |
3种常规土地利用分类方法(最小距离法、最大似然法、支持向量机法)使用了相同的点样本; 2种深度卷积神经网络方法(PIE-Engine AI Attention_UNet和自研的ODCC)使用了相同的面样本。其中,面样本是以点样本为中心构建大小为64像素×64像素的图像块,并通过人工目视解译结合现场实地调查制作的,样本数量与点样本相同。所有实验方法均在同一个工作站运行,配置为: Intel Xeon Gold 5118 CPU @2.30 GHz处理器,NVIDIA GeForce RTX 2080 Ti显卡,12 GB显卡内存,16 GB运行内存。不同软件在运行相同方法时设置相同的关键参数,如表4所示。
表4 不同方法参数设置
Tab.4
处理方法 | 参数设置 |
---|---|
最小距离法 | — |
最大似然法 | — |
支持向量机法 | 核函数: Radial Basis Function;惩罚系数: 20 |
深度卷积神经网络法 | 学习率: 0.000 1;迭代次数: 300;批次大小: 16;优化器:随机梯度下降 |
面向对象分类前处理 | 多尺度分割,分割尺度: 50;形状因子权重: 0.3;紧致度权重: 0.5 |
本研究从定量评价和定性的视觉效果评价2个方面对分类结果进行评价。其中定量评价的指标包含分类精度和分类效率。分类精度评价指标为依据混淆矩阵计算的总体精度(overall accuracy,OA)和Kappa系数。分类效率评价指标为软件分类过程运行的时间[24]。
3 结果与讨论
3.1 实验结果定量评价
面向像元分类的精度和效率结果如表5所示。除深度卷积神经网络法以外,从分类精度来看,ENVI和ERDAS软件在分别运行3种分类方法时,OA和Kappa呈现相同的高低排序,即支持向量机法分类结果的OA和Kappa最高,最大似然法分类结果次之,最小距离法最低。PIE-Basic软件的最大似然法具有最高的OA和Kappa,支持向量机法次之,最小距离法最低。分类方法相同的情况下(3种常规分类方法),ENVI软件均取得了最高的OA和Kappa,PIE-Basic和ERDAS软件则各有高低。3种常规分类方法实验中,ENVI软件的支持向量机分类结果取得的OA和Kappa最高,分别是73.34%和0.673,次优的结果是ERDAS软件的支持向量机分类结果,OA和Kappa分别是71.14%和0.647。ERDAS软件的最小距离分类结果的OA和Kappa最低,分别是61.99%和0.539。从运行时间的角度来看,PIE-Basic,ENVI和ERDAS软件分别运行3种常规分类方法消耗的时间也呈现相同的高低排序,即支持向量机法消耗时间最长,最大似然法次之,最小距离法耗时最短。在分类方法相同的情况下,ENVI软件的分类时间消耗都是最长的。所有实验中,ENVI软件的支持向量机分类消耗时间最长,为162 s,ERDAS软件的最小距离分类消耗时间最短,仅需9 s。值得注意的是,ERDAS软件的支持向量机分类结果的OA和Kappa仅比相同方法的ENVI软件结果低2.2个百分点和0.026,但是运行时长仅为ENVI软件的22%。综上所述,若仅仅追求更高的分类精度,ENVI软件为首选;若兼顾精度和运行效率,ERDAS软件是恰当的选择。
表5 面向像元分类的精度和运行时间对比
Tab.5
分类方法 | 软件 | OA/% | Kappa | 时间/s |
---|---|---|---|---|
最小距离法 | PIE-Basic | 63.09 | 0.551 | 12 |
ENVI | 67.19 | 0.601 | 51 | |
ERDAS | 61.99 | 0.539 | 9 | |
最大似然法 | PIE-Basic | 70.03 | 0.632 | 47 |
ENVI | 69.24 | 0.622 | 64 | |
ERDAS | 67.08 | 0.596 | 15 | |
支持向量机法 | PIE-Basic | 67.67 | 0.607 | 68 |
ENVI | 73.34 | 0.673 | 162 | |
ERDAS | 71.14 | 0.647 | 36 | |
Attention_UNet | PIE-Engine AI | 85.65 | 0.825 | — |
面向对象分类的精度和效率结果如表6所示。除深度卷积神经网络法以外,ENVI和eCognition软件在分别运行3种分类方法时,OA和Kappa呈现相同的高低排序,即支持向量机法的OA和Kappa最高,最大似然法次之,最小距离法最低。而PIE-SIAS软件的最大似然法的结果OA和Kappa最高,支持向量机法次之,最小距离法最低。在分类方法相同的情况下(3种常规分类方法),eCognition软件均取得了最高的OA和Kappa,ENVI软件次之,PIE-SIAS软件最低。3种常规分类方法实验中,OA和Kappa最高的是eCognition软件的支持向量机法,分别为78.39%和0.737,最低的是PIE-SIAS软件的最小距离法,OA和Kappa分别为72.60%和0.664。以对象为基本单位分类时,分类前影像分割处理的时间也能体现软件的运行效率,因此在运行时间对比中包含了影像分割的时间。从运行时间的角度来看,ENVI软件的影像分割时间最长,为96 s,eCognition软件次之,PIE-SIAS软件最短。在运行最大似然法和支持向量机法时,eCognition软件相较于ENVI和PIE-SIAS软件的分类时间具有明显优势。在所有实验中,总时间消耗最短的是PIE-SIAS软件的最小距离法,但其精度明显较低。相比之下,eCognition软件的支持向量机法与总时间消耗最短的PIE-SIAS的最小距离法相比,仅增加了32 s的时间消耗,便达到了所有软件和3种常规分类方法中最高的精度。综上所述,从精度和效率双重因素考量下,eCognition软件在进行面向对象分类时更具优势。另外,对比表5和表6可以看出,面向对象的任一软件和任一常规分类方法相较于面向像元的对应软件和对应方法均取得更高的精度和更短的分类时间,在复杂矿山土地利用分类场景中更具有精度和效率优势。
表6 面向对象分类的精度和运行时间对比
Tab.6
分类方法 | 软件 | OA/% | Kappa | 分割时间/s | 分类时间/s | 总时间/s |
---|---|---|---|---|---|---|
最小距离法 | PIE-SIAS | 72.60 | 0.664 | 53 | 9 | 62 |
ENVI | 73.66 | 0.679 | 96 | 22 | 118 | |
eCognition | 75.87 | 0.706 | 89 | 4 | 93 | |
最大似然法 | PIE-SIAS | 74.29 | 0.686 | 53 | 38 | 91 |
eCognition | 76.66 | 0.716 | 89 | 4 | 93 | |
支持向量机法 | PIE-SIAS | 73.50 | 0.677 | 53 | 56 | 109 |
ENVI | 75.39 | 0.700 | 96 | 211 | 307 | |
eCognition | 78.39 | 0.737 | 89 | 5 | 94 | |
ODCC | Python+Pycharm | 93.95 | 0.940 | — | — | — |
由于深度卷积神经网络法与3种常规土地利用分类方法的训练与测试机制不同,因此对其结果进行单独分析,且不再对比方法的效率。Attention_UNet的OA和Kappa分别是85.65%和0.825(表5); ODCC的OA和Kappa分别为93.95%和0.940(表6)。2种深度卷积神经网络法的精度相较于3种常规土地利用分类方法有了明显提升。实验表明,相比用户自主构建的深度卷积神经网络,使用PIE-Engine AI平台自带的深度学习算法和流程化的操作功能,可以降低用户的编程工作量和实现难度,同时其云计算平台能够减轻用户端计算资源的占用压力,在精度允许的条件下可提升教学活动和科研数据处理的效率。但是,PIE-Engine AI平台在运行深度卷积神经网络算法时灵活性较差,比如不支持用户自己定义损失函数、优化器可选项有限等。
3.2 实验结果定性视觉效果评价
本节对上述ENVI软件的支持向量机法(3种常规分类方法面向像元分类中精度最高)、eCognition软件的支持向量机法(3种常规分类方法面向对象分类中精度最高)以及2种深度卷积神经网络法的分类结果进行定性的视觉效果分析。4个分类实验的结果如图3所示。总体来看,面向像元-支持向量机的分类结果和面向对象-支持向量机的分类结果图斑较为破碎,而2种深度卷积神经网络法的分类结果图斑相对更完整。从细节上来看,ODCC的实验结果明显优于其他3个实验的分类结果,如:
图3-1
图3-2
1)ODCC对露天采场分类较为准确,而其他3种分类方法对露天采场存在明显的误分类,即将露天采场中暗色调的区域错误分类为植被(区域1和区域2)。
2)复垦区指的是对采矿损毁土地进行植被修复的区域,从像元的角度难以区分植被和复垦区,所以ENVI面向像元的分类结果中明显存在更多的植被与复垦区2种土地利用类型的混淆,而其他结果中这种类型的错误明显更少,其中ODCC的错分类最少(区域3、区域4和区域5)。
3)由于建筑物、裸地和排土场3种地物类型面积较小,分类结果差异较小,但是也能看出ODCC得到的结果最优,具体表现为分类结果与地物真实边界更吻合(区域6、区域7和区域8)。
4)就2种深度卷积神经网络法而言,Attention_UNet算法的结果存在明显的拼接线,而ODCC采用了面向对象的机制则有效缓解了这一问题(区域9和区域10)。
综上所述,根据矿山复杂场景特征构建的ODCC算法相较于3种常规方法和PIE-Engine AI 平台提供的Attention_UNet算法更适合矿山土地利用分类。因此,在软件平台中引入面向对象的深度卷积神经网络算法,并为用户提供更便利的操作方式,如用户可以在软件平台中根据场景需求灵活构建网络算法,是未来软件版本升级的重要功能需求。
4 结论与展望
本文以复杂矿山场景土地利用分类为任务对象,分别对比了PIE,ENVI,ERDAS和eCognition这4种图像处理软件以及分析了自主研发的ODCC方法的性能,可以得出如下结论:
1)在常规分类方法中,ENVI软件在面向像元分类实验中表现出了更高的分类精度,但分类效率最低。PIE和ERDAS在不同的常规分类方法中分别表现了各自的精度优势,而ERDAS在兼顾精度和时间效率方面最为出色。
2)在常规分类方法中,eCognition软件在面向对象分类实验中展现出了最高的分类精度和分类效率。同时,实验结果表明,面向对象分类策略在精度方面明显优于面向像元的策略。
3)深度卷积神经网络法的精度显著优于常规分类方法,而根据特定复杂矿山场景优化的深度卷积神经网络算法较现有平台中的方法具有更高的分类精度,为后续软件升级提出了更高的应用需求。
本文结果能够为相关工作者根据教学活动和科研数据处理的任务需求选择合适的遥感图像处理软件提供科学依据。同时,期望遥感主流教学科研软件添加更加灵活的深度卷积神经网络算法应用模块,更好地满足行业领域的应用需求。
参考文献
中国遥感软件研制进展与发展方向——以像素专家PIE为例
[J].
Research progress and development direction of Chinese remote sensing software:Taking PIE as an example
[J].
Special issue on advances in real-time image processing for remote sensing
[J].
基于ENVI的遥感图像监督分类方法比较研究
[J].
The comparative study of remote sensing image supervised classification methods based on ENVI
[J].
Land use/land cover change impact on streamflow using Arc-SWAT model,in case of Fetamwatershed,AbbayBasin,Ethiopia
[J].
eCognition(易康)软件在地理国情普查地表覆盖解译中的应用
[J].
The application of eCognition software in the interpretation of land cover in geographical national survey
[J].
PIE系列遥感软件在测绘类专业体验式教学中的应用
[J].
The application of PIE remote sensing software in experiential teaching of surveying and mapping
[J].
基于DeepLabv3+与GF-2高分辨率影像的露天煤矿区土地利用分类
[J].
Recognition of land use on open-pit coal mining area based on DeepLabv3+ and GF-2 high-resolution images
[J].
基于U-Net网络和GF-6影像的尾矿库空间范围识别
[J].
Recognition of the spatial scopes of tailing ponds based on U-Net and GF-6 images
[J].
煤炭开采背景下的伊金霍洛旗土地利用变化强度分析
[J].
Application of intensity analysis theory in the land use change in YijinHolo Banner under the background of coal mining
[J].
基于eCognition的遥感图像面向对象分类方法研究
[J].
Study on object-oriented classification method of remote sensing image based on eCognition
[J].
国外四大遥感软件影像分类过程及效果比较
[J].
Comparisons of classification processes and results of 4 kinds of foreign remote sensing image
[J].
基于分层次多尺度分割的缅甸达贡山镍矿矿区信息提取与动态变化监测
[J].
Hierarchical multi-scale segmentation-based information extraction and dynamic change monitoring in TagaungTaung nickel deposit,Myanmar
[J].
基于ENVI软件对忻州窑矿土地类型识别及精度评价
[J].
Recognition of land features and accuracy evaluation of Xinzhouyao mine based on ENVI software
[J].
鄂尔多斯煤田高强度井工煤矿开采对土壤物理性质的扰动
[J].
Effect of high-intensity underground coal mining disturbance on soil physical properties
[J].
A new method for the extraction of tailing ponds from very high-resolution remotely sensed images:PSVED
[J].
Changes detection and object-oriented classification of major wetland cover types in response to driving forces in ZoigeCounty,Eastern Qinghai-Tibetan Plateau
[J].
Comparative analysis of supervised methods for the classification of mountain forests based on space imagery from the satellite RapidEye
[J].
The impact of spatiotemporal changes in land development (1984—2019) on the increase in the runoff coefficient in erbil,Kurdistan region of Iraq
[J].
Exploitation of time series Sentinel-2 data and different machine learning algorithms for detailed tree species classification
[J].
Deep convolutional neural networks for surface coal mines determination from Sentinel-2 images
[J].
DOI:10.1080/22797254.2021.1920341
[本文引用: 1]
Coal is a principal source of energy and the combustion of coal supplies around one-third of the global electricity generation. Coal mines are also an important source of CH4 emissions, the second most important greenhouse gas. Monitoring CH4 emissions caused by coal mining using earth observation will require the exact location of coal mines. This paper aims to determine surface coal mines from satellite images through deep learning techniques by treating them as a land use/land cover classification task. This is achieved using Convolutional Neural Networks (CNN) that has proven to be capable of complex land use/land cover classification tasks. With a list of known coal mine locations from various countries, a training dataset of "Coal Mine" and "No Coal Mine" image patches is prepared using Sentinel-2 satellite images with 13 spectral bands. Various pre-trained CNN network architectures (VGG, ResNet, DenseNet) are trained and validated with our prepared coal mine dataset of 3500 "Coal Mine" and 3000 "No Coal Mine" image patches. After several experiments with the VGG network combined with transfer learning is found to be an optimal model for this task. Classification accuracy of 98% has been achieved for the validation dataset of the pre-trained VGG architecture. The model produces more than 95% overall accuracy when tested on unseen satellite images from different countries outside the training dataset and evaluated against visual classification.
Densely connected con-volutional networks
Deformable convolutional networks
CBAM:Convolutional block attention module
[C]//
Improving vegetation segmentation with shadow effects based on double input networks using polarization images
[J].
/
〈 |
|
〉 |
