遥感主流教学科研软件在复杂矿山场景土地利用分类中的对比研究

doi:10.6046/zrzyyg.2023394

遥感主流教学科研软件在复杂矿山场景土地利用分类中的对比研究

张成业^,¹^,², 李梦圆¹, 邢江河^,¹, 邱宇航¹

1.中国矿业大学(北京)地球科学与测绘工程学院,北京 100083

2.中国矿业大学(北京)煤炭精细勘探与智能开发全国重点实验室,北京 100083

Comparative study of popular remote sensing teaching and research software for land use classification in a complex mine scene

ZHANG Chengye^,¹^,², LI Mengyuan¹, XING Jianghe^,¹, QIU Yuhang¹

1. College of Geoscience and Surveying Engineering, China University of Mining and Technology (Beijing), Beijing 100083, China

2. State Key Laboratory of Coal Fine Exploration and Intelligent Development, China University of Mining and Technology (Beijing), Beijing 100083, China

通讯作者: 邢江河(1997-),男,博士研究生,主要从事矿区土地利用遥感识别等研究。Email:xingjh0929@163.com。

收稿日期: 2023-12-20 修回日期: 2024-02-29

基金资助:

国家自然科学基金项目“露天煤矿区植被扰动过程遥感提取方法与全国分区时空规律挖掘”(42371347)
教育部产学合作协同育人项目“面向PIE首套实践教材的遥感数字图像处理体验式课程建设与共享”(202101162010)

Received: 2023-12-20 Revised: 2024-02-29

作者简介 About authors

张成业(1991-),男,博士,副教授、博导,主要从事矿区生态遥感监测等研究。Email: czhang@cumtb.edu.cn。

摘要

遥感图像处理软件的性能直接制约了相关工作者开展教学和科研活动的效果和效率。该文以复杂矿山场景土地利用分类为任务对象,对比研究了PIE,ENVI,ERDAS和eCognition等主流遥感软件以及分析了自研的深度学习算法的性能。结果表明: ①ENVI在常规方法面向像元分类时表现出最高的总体精度(overall accuracy,OA)和Kappa系数,但分类效率最低,相比之下,ERDAS在兼顾较高精度的条件下运行效率最高; ②eCognition在常规方法面向对象分类时取得了最优的OA和Kappa,也具备较高的运行效率; ③深度卷积神经网络算法相较于常规方法的分类结果具有明显的精度优势。文章定量地揭示了不同软件在不同策略方法上的性能表现,能够为相关工作者选择合适的图像处理软件、提升教学效果和科研效率提供科学依据。

关键词： 遥感软件; 复杂矿山; 土地利用分类; 教学科研; 神经网络

Abstract

The performance of remote sensing image processing software directly influences the effectiveness and efficiency of teaching and research activities conducted by related workers. Focusing on land use classification in a complex mine scene, this study comparatively investigated the performance of popular remote sensing software including Pixel Information Expert (PIE), Environment for Visualizing Images (ENVI), ERDAS IMAGINE (ERDAS), and eCognition Developer (eCognition), and the self-developed deep learning algorithm. The results show that ENVI yielded the highest overall accuracy (OA) and Kappa coefficient but the lowest classification efficiency in conventional pixel-oriented classification. In contrast, ERDAS exhibited the highest operational efficiency while maintaining relatively high accuracy. eCognition achieved the optimal OA and Kappa coefficient and relatively high operational efficiency in conventional object-oriented classification. The deep convolutional neural network algorithm demonstrated superior accuracy over the classification results of conventional methods. Overall, this study quantitatively revealed the performance of various software on different strategies and methods, providing a scientific basis for related workers to choose appropriate image processing software and improve teaching effect and research efficiency.

Keywords： remote sensing software; complex mine; land use classification; teaching and research; neural network

PDF (4756KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

张成业, 李梦圆, 邢江河, 邱宇航. 遥感主流教学科研软件在复杂矿山场景土地利用分类中的对比研究[J]. 自然资源遥感, 2025, 37(3): 9-16 doi:10.6046/zrzyyg.2023394

ZHANG Chengye, LI Mengyuan, XING Jianghe, QIU Yuhang. Comparative study of popular remote sensing teaching and research software for land use classification in a complex mine scene[J]. Remote Sensing for Land & Resources, 2025, 37(3): 9-16 doi:10.6046/zrzyyg.2023394

0 引言

遥感数字图像数据的获取、处理、应用是遥感技术实施的3个主要步骤,其中遥感数字图像处理是遥感技术过程的关键环节,其处理结果的优劣直接决定了能否满足行业领域的应用需求^[1-2]。作为人才培养和科学研究的重要源头,过去几十年来高校遥感专业的教学和科研主要依赖国外版权的图像处理软件,如ENVI,ERDAS和eCognition等^[3-5]。近年来,国产遥感图像处理软件PIE也逐渐走入高校教学和科研工作^[6]。然而,不同遥感图像处理软件在不同处理任务上的精度和效率有明显差异,如何根据任务场景选择合适的处理软件是教学科研工作者关心的重要问题。矿山土地利用是自然资源遥感的主要应用场景之一,是地质矿业类高校遥感专业教学与科研活动的重要组成内容^[7-9]。开展遥感主流教学科研软件在复杂矿山场景土地利用分类中的对比研究,能够为相关工作者选择合适的图像处理软件,提升教学效果和科研效率提供科学依据。

当前,一些学者对上述软件开展了一定的对比研究,也在矿山土地利用分类中开展了应用。陈蕊等^[10]利用eCognition软件进行面向对象分类方法的研究,并与ENVI软件进行对比分析,结果表明基于面向对象分类方法的eCognition软件在城市场景土地利用分类研究中更具可靠性;王海芹等^[11]对国外主流遥感软件的土地利用分类过程和结果进行分析,定性地阐述了各个软件的优缺点,但缺少实验数据支持;陈理等^[12]利用eCognition软件对缅甸达贡山镍矿进行了2期的土地利用分类,并对矿山土地利用类型的动态变化进行了分析;邵亚琴等^[13]利用ENVI软件在忻州窑矿开展了5期的土地利用类型分类,服务于矿山土地发展分析。虽然上述研究在土地利用分类方向上对不同遥感软件进行了对比和应用,但是仍然存在如下问题: ①缺少以实验数据验证的方式对PIE,ENVI,ERDAS和eCognition软件不同分类方法的全面对比; ②缺少上述软件在矿山土地利用遥感分类任务上的对比研究。

因此,本文以复杂矿山场景土地利用分类为任务对象,对比研究PIE,ENVI,ERDAS和eCognition等软件在不同分类策略(面向像元的分类策略和面向对象的分类策略)和不同分类方法(最小距离法、最大似然法、支持向量机、深度卷积神经网络)上的精度和效率,对比实验结果定量地揭示不同软件在不同策略方法上的性能表现,为相关工作者根据教学内容和科研需求选择恰当软件提供重要参考。

1 研究区概况与数据源

1.1 研究区概况

研究区位于内蒙古自治区鄂尔多斯市露天煤矿聚集区,经纬度范围为110°28'12″~ 110°36'05″E,39°25'56″~ 39°39'54″N,面积为81.35 km²,属于高山丘陵和沟壑地貌,地表侵蚀强烈,水土流失严重^[14]。研究区涵盖西梁煤矿、来叶沟煤矿等8个露天煤矿,土地利用类型既包括矿山场景特色土地利用类型(如露天采场、排土场、复垦区等),也包括常规土地利用类型(如建筑、植被、裸地等)。研究区土地利用场景较为复杂,类内异质性大,类间边界区分难度大。

1.2 研究数据

本研究使用的遥感影像由高分六号(GF-6)全色多光谱扫描仪获取,包括全色图像和多光谱图像,成像时间为2019年12月10日。首先,对图像进行辐射定标、大气校正、几何纠正和正射校正等预处理。其次,为充分利用图像空间信息和光谱信息,利用Pansharpening算法对全色图像和多光谱图像进行图像融合^[15]。融合后的图像包含红光、绿光、蓝光和近红外4个波段,空间分辨率为2 m。研究区域的位置和影像覆盖情况如图1所示。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 研究区位置与遥感影像图

Fig.1 The location and remotely-sensed image of the study area

结合遥感影像数据和现场实地调查结果,本研究将研究区域分类为6种土地利用类型,包括露天采场、复垦区、排土场、建筑物、植被和裸地。本研究利用人工目视解译与野外调查相结合的方式构建样本集,构建过程中充分考虑样本在不同土地利用类型上的多样性和均衡性,降低样本因素对不同软件对比结果的影响。样本集共有2 262个样本,不同土地利用类型的样本数量如表1所示。

表1 不同土地利用类型的样本数量

Tab.1 Number of samples for different land use types(个)

土地利用类型	训练集样本	测试集样本	总计
露天采场	331	116	447
排土场	218	108	326
复垦区	240	107	347
建筑	200	120	320
植被	344	175	519
裸地	201	102	303
总计	1 534	728	2 262

新窗口打开| 下载CSV

2 实验方法和设置

2.1 实验方法

本研究分别采用面向像元^[3]和面向对象^[16]的分类策略进行对比实验,采用的分类方法为最小距离法、最大似然法、支持向量机法和深度卷积神经网络法。

1)最小距离法。最小距离法属于距离判断分类法中的典型代表方法^[17]。该方法以待分类像元的特征值到各类别训练样本特征值的距离作为分类依据。本文具体实现过程为:首先,通过训练样本计算各类别的特征均值;然后,计算待分类像元的特征与各类别特征均值的欧氏距离;最后,将待分类像元归入到距离最小的类别中。

2)最大似然法。最大似然法是根据概率判别函数和贝叶斯判别规则进行分类的方法^[18]。本文具体实现过程为:首先,定义一个归属于某个类别的概率分布集群;然后,计算待分类像元归属各类别的条件概率;最后,将待分类像元归入到条件概率最大的类别中。

3)支持向量机法。支持向量机法是一种基于统计学习理论的机器学习方法^[19]。本文具体实现过程为:首先,利用核函数将样本特征映射到高维空间中;然后,在特征的高维空间中构建一个超平面,最大化各类样本特征到超平面的距离;最后,以构建的超平面为分类依据,对像元进行分类。

4)深度卷积神经网络法。神经网络是一种模拟人脑神经思维方式的数据模型,其目标是通过模拟人脑识别、记忆、思考的过程来实现遥感图像分类^[20]。随着深度学习人工智能的迅速发展,卷积神经网络和全卷积神经网络成为遥感图像土地利用分类的热点方法。本研究分别采用PIE-Engine AI平台的全卷积神经网络Attention_UNet模型和笔者自研的基于面向对象的改进型密集连接卷积网络(object-oriented improved densely connected convolutional network,ODCC)进行面向像元和面向对象的矿山土地利用分类。ODCC模型的网络结构如图2所示,它采用面向对象的分类策略,并在原密集连接卷积网络的基础上融合了可变形卷积模块和卷积注意力模块(convolutional block attention module,CBAM)^[21-23]。面向对象策略的使用可以减少分类噪声,也使得地物分类结果的边界更符合人类感知;可变形卷积的使用增强了模型对不同形状地物的适应性能; CBAM的使用有助于矿山地物特征信息的筛选,提高分类效率和准确性。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 ODCC的网络结构

Fig.2 Structure of ODCC

2.2 实验设置

本研究对比的软件平台及其版本为: PIE-Basic7.0,PIE-SIAS7.0,PIE-Engine AI,ENVI5.3,ERDAS IMAGINE 2022和eCognition Developer9.0。笔者自研的ODCC是使用Python3.6编程语言实现,运行平台为PyCharm(Community Edition 2020.2.1×64)。不同软件可以实现的分类方法不同,根据各软件涵盖的方法情况,本研究设置了一系列对比实验,如表2和表3所示。

表2 面向像元分类的对比实验

Tab.2 Comparative experiments on pixel-oriented classification

面向像元分类方法	PIE- Basic	PIE- Engine AI	ENVI	ERDAS	eCognition
最小距离法	√	×	√	√	×
最大似然法	√	×	√	√	×
支持向量机法	√	×	√	√	×
Attention_UNet	×	√	×	×	×

新窗口打开| 下载CSV

表3 面向对象分类的对比实验

Tab.3 Comparative experiments on object-oriented classification

面向对象分类方法	PIE-SIAS	ENVI	ERDAS	eCognition	Python+ PyCharm
最小距离法	√	√	×	√	×
最大似然法	√	×	×	√	×
支持向量机法	√	√	×	√	×
ODCC	×	×	×	×	√

新窗口打开| 下载CSV

3种常规土地利用分类方法(最小距离法、最大似然法、支持向量机法)使用了相同的点样本; 2种深度卷积神经网络方法(PIE-Engine AI Attention_UNet和自研的ODCC)使用了相同的面样本。其中,面样本是以点样本为中心构建大小为64像素×64像素的图像块,并通过人工目视解译结合现场实地调查制作的,样本数量与点样本相同。所有实验方法均在同一个工作站运行,配置为: Intel Xeon Gold 5118 CPU @2.30 GHz处理器,NVIDIA GeForce RTX 2080 Ti显卡,12 GB显卡内存,16 GB运行内存。不同软件在运行相同方法时设置相同的关键参数,如表4所示。

表4 不同方法参数设置

Tab.4 Parameter settings for different methods

处理方法	参数设置
最小距离法	—
最大似然法	—
支持向量机法	核函数: Radial Basis Function;惩罚系数: 20
深度卷积神经网络法	学习率: 0.000 1;迭代次数: 300;批次大小: 16;优化器:随机梯度下降
面向对象分类前处理	多尺度分割,分割尺度: 50;形状因子权重: 0.3;紧致度权重: 0.5

新窗口打开| 下载CSV

本研究从定量评价和定性的视觉效果评价2个方面对分类结果进行评价。其中定量评价的指标包含分类精度和分类效率。分类精度评价指标为依据混淆矩阵计算的总体精度(overall accuracy,OA)和Kappa系数。分类效率评价指标为软件分类过程运行的时间^[24]。

3 结果与讨论

3.1 实验结果定量评价

面向像元分类的精度和效率结果如表5所示。除深度卷积神经网络法以外,从分类精度来看,ENVI和ERDAS软件在分别运行3种分类方法时,OA和Kappa呈现相同的高低排序,即支持向量机法分类结果的OA和Kappa最高,最大似然法分类结果次之,最小距离法最低。PIE-Basic软件的最大似然法具有最高的OA和Kappa,支持向量机法次之,最小距离法最低。分类方法相同的情况下(3种常规分类方法),ENVI软件均取得了最高的OA和Kappa,PIE-Basic和ERDAS软件则各有高低。3种常规分类方法实验中,ENVI软件的支持向量机分类结果取得的OA和Kappa最高,分别是73.34%和0.673,次优的结果是ERDAS软件的支持向量机分类结果,OA和Kappa分别是71.14%和0.647。ERDAS软件的最小距离分类结果的OA和Kappa最低,分别是61.99%和0.539。从运行时间的角度来看,PIE-Basic,ENVI和ERDAS软件分别运行3种常规分类方法消耗的时间也呈现相同的高低排序,即支持向量机法消耗时间最长,最大似然法次之,最小距离法耗时最短。在分类方法相同的情况下,ENVI软件的分类时间消耗都是最长的。所有实验中,ENVI软件的支持向量机分类消耗时间最长,为162 s,ERDAS软件的最小距离分类消耗时间最短,仅需9 s。值得注意的是,ERDAS软件的支持向量机分类结果的OA和Kappa仅比相同方法的ENVI软件结果低2.2个百分点和0.026,但是运行时长仅为ENVI软件的22%。综上所述,若仅仅追求更高的分类精度,ENVI软件为首选;若兼顾精度和运行效率,ERDAS软件是恰当的选择。

表5 面向像元分类的精度和运行时间对比

Tab.5 Comparison of accuracy and runtime for pixel-oriented classification

分类方法	软件	OA/%	Kappa	时间/s
最小距离法	PIE-Basic	63.09	0.551	12
	ENVI	67.19	0.601	51
	ERDAS	61.99	0.539	9
最大似然法	PIE-Basic	70.03	0.632	47
	ENVI	69.24	0.622	64
	ERDAS	67.08	0.596	15
支持向量机法	PIE-Basic	67.67	0.607	68
	ENVI	73.34	0.673	162
	ERDAS	71.14	0.647	36
Attention_UNet	PIE-Engine AI	85.65	0.825	—

新窗口打开| 下载CSV

面向对象分类的精度和效率结果如表6所示。除深度卷积神经网络法以外,ENVI和eCognition软件在分别运行3种分类方法时,OA和Kappa呈现相同的高低排序,即支持向量机法的OA和Kappa最高,最大似然法次之,最小距离法最低。而PIE-SIAS软件的最大似然法的结果OA和Kappa最高,支持向量机法次之,最小距离法最低。在分类方法相同的情况下(3种常规分类方法),eCognition软件均取得了最高的OA和Kappa,ENVI软件次之,PIE-SIAS软件最低。3种常规分类方法实验中,OA和Kappa最高的是eCognition软件的支持向量机法,分别为78.39%和0.737,最低的是PIE-SIAS软件的最小距离法,OA和Kappa分别为72.60%和0.664。以对象为基本单位分类时,分类前影像分割处理的时间也能体现软件的运行效率,因此在运行时间对比中包含了影像分割的时间。从运行时间的角度来看,ENVI软件的影像分割时间最长,为96 s,eCognition软件次之,PIE-SIAS软件最短。在运行最大似然法和支持向量机法时,eCognition软件相较于ENVI和PIE-SIAS软件的分类时间具有明显优势。在所有实验中,总时间消耗最短的是PIE-SIAS软件的最小距离法,但其精度明显较低。相比之下,eCognition软件的支持向量机法与总时间消耗最短的PIE-SIAS的最小距离法相比,仅增加了32 s的时间消耗,便达到了所有软件和3种常规分类方法中最高的精度。综上所述,从精度和效率双重因素考量下,eCognition软件在进行面向对象分类时更具优势。另外,对比表5和表6可以看出,面向对象的任一软件和任一常规分类方法相较于面向像元的对应软件和对应方法均取得更高的精度和更短的分类时间,在复杂矿山土地利用分类场景中更具有精度和效率优势。

表6 面向对象分类的精度和运行时间对比

Tab.6 Comparison of accuracy and runtime for object-oriented classification

分类方法	软件	OA/%	Kappa	分割时间/s	分类时间/s	总时间/s
最小距离法	PIE-SIAS	72.60	0.664	53	9	62
	ENVI	73.66	0.679	96	22	118
	eCognition	75.87	0.706	89	4	93
最大似然法	PIE-SIAS	74.29	0.686	53	38	91
最大似然法	eCognition	76.66	0.716	89	4	93
支持向量机法	PIE-SIAS	73.50	0.677	53	56	109
	ENVI	75.39	0.700	96	211	307
	eCognition	78.39	0.737	89	5	94
ODCC	Python+Pycharm	93.95	0.940	—	—	—

新窗口打开| 下载CSV

由于深度卷积神经网络法与3种常规土地利用分类方法的训练与测试机制不同,因此对其结果进行单独分析,且不再对比方法的效率。Attention_UNet的OA和Kappa分别是85.65%和0.825(表5); ODCC的OA和Kappa分别为93.95%和0.940(表6)。2种深度卷积神经网络法的精度相较于3种常规土地利用分类方法有了明显提升。实验表明,相比用户自主构建的深度卷积神经网络,使用PIE-Engine AI平台自带的深度学习算法和流程化的操作功能,可以降低用户的编程工作量和实现难度,同时其云计算平台能够减轻用户端计算资源的占用压力,在精度允许的条件下可提升教学活动和科研数据处理的效率。但是,PIE-Engine AI平台在运行深度卷积神经网络算法时灵活性较差,比如不支持用户自己定义损失函数、优化器可选项有限等。

3.2 实验结果定性视觉效果评价

本节对上述ENVI软件的支持向量机法(3种常规分类方法面向像元分类中精度最高)、eCognition软件的支持向量机法(3种常规分类方法面向对象分类中精度最高)以及2种深度卷积神经网络法的分类结果进行定性的视觉效果分析。4个分类实验的结果如图3所示。总体来看,面向像元-支持向量机的分类结果和面向对象-支持向量机的分类结果图斑较为破碎,而2种深度卷积神经网络法的分类结果图斑相对更完整。从细节上来看,ODCC的实验结果明显优于其他3个实验的分类结果,如:

图3-1

新窗口打开| 下载原图ZIP| 生成PPT

图3-1 4个分类实验的结果

Fig.3-1 Results of the four classification experiments

图3-2

新窗口打开| 下载原图ZIP| 生成PPT

图3-2 4个分类实验的结果

Fig.3-2 Results of the four classification experiments

1)ODCC对露天采场分类较为准确,而其他3种分类方法对露天采场存在明显的误分类,即将露天采场中暗色调的区域错误分类为植被(区域1和区域2)。

2)复垦区指的是对采矿损毁土地进行植被修复的区域,从像元的角度难以区分植被和复垦区,所以ENVI面向像元的分类结果中明显存在更多的植被与复垦区2种土地利用类型的混淆,而其他结果中这种类型的错误明显更少,其中ODCC的错分类最少(区域3、区域4和区域5)。

3)由于建筑物、裸地和排土场3种地物类型面积较小,分类结果差异较小,但是也能看出ODCC得到的结果最优,具体表现为分类结果与地物真实边界更吻合(区域6、区域7和区域8)。

4)就2种深度卷积神经网络法而言,Attention_UNet算法的结果存在明显的拼接线,而ODCC采用了面向对象的机制则有效缓解了这一问题(区域9和区域10)。

综上所述,根据矿山复杂场景特征构建的ODCC算法相较于3种常规方法和PIE-Engine AI 平台提供的Attention_UNet算法更适合矿山土地利用分类。因此,在软件平台中引入面向对象的深度卷积神经网络算法,并为用户提供更便利的操作方式,如用户可以在软件平台中根据场景需求灵活构建网络算法,是未来软件版本升级的重要功能需求。

4 结论与展望

本文以复杂矿山场景土地利用分类为任务对象,分别对比了PIE,ENVI,ERDAS和eCognition这4种图像处理软件以及分析了自主研发的ODCC方法的性能,可以得出如下结论:

1)在常规分类方法中,ENVI软件在面向像元分类实验中表现出了更高的分类精度,但分类效率最低。PIE和ERDAS在不同的常规分类方法中分别表现了各自的精度优势,而ERDAS在兼顾精度和时间效率方面最为出色。

2)在常规分类方法中,eCognition软件在面向对象分类实验中展现出了最高的分类精度和分类效率。同时,实验结果表明,面向对象分类策略在精度方面明显优于面向像元的策略。

3)深度卷积神经网络法的精度显著优于常规分类方法,而根据特定复杂矿山场景优化的深度卷积神经网络算法较现有平台中的方法具有更高的分类精度,为后续软件升级提出了更高的应用需求。

本文结果能够为相关工作者根据教学活动和科研数据处理的任务需求选择合适的遥感图像处理软件提供科学依据。同时,期望遥感主流教学科研软件添加更加灵活的深度卷积神经网络算法应用模块,更好地满足行业领域的应用需求。

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

刘东升, 廖通逵, 孙焕英,

等.

中国遥感软件研制进展与发展方向——以像素专家PIE为例

[J]. 中国图象图形学报, 2021, 26(5):1169-1178.