九寨沟生物圈保护区大场景植被健康遥感精细监测与诠析——以长海为例
Fine-scale remote sensing monitoring and interpretation of large-scene vegetation health in the Jiuzhai Valley biosphere reserve: A case study of the Changhai pilot zone
通讯作者: 陈富龙(1980-),男,研究员,研究方向为文化遗产遥感智能感知与可持续保护。Email:chenfl@aircas.ac.cn。
责任编辑: 张仙
收稿日期: 2023-03-8 修回日期: 2023-06-2
基金资助: |
|
Received: 2023-03-8 Revised: 2023-06-2
作者简介 About authors
高 昇(1999-),男,硕士研究生,研究方向为植被光学遥感。Email:
在自然过程、地质灾害和人为扰动的交织影响下,生物圈保护区植被健康风险提升,如何从复杂大场景精准提取与识别植被健康信息面临技术挑战。文章充分利用遥感技术宏观、客观与定量的优势,选取九寨沟生物圈保护区长海试验区为例,提出了一种集特征提取和随机森林的大场景植被健康遥感精细监测方法,实现了典型生物圈保护区不健康树木的信息提取与目标识别。结果表明: 应用光谱特征和纹理特征相结合的随机森林分类方法,在高分辨率遥感影像中可以精细提取森林中零散分布的不健康树木; 红绿指数、归一化植被指数、红边波段、红光波段相关性和修正的土壤调整植被指数是遥感植被健康信息提取的典型特征; 长海实验区植被健康状况总体较好,不健康树木占比0.23%,同时地质灾害对不健康树木空间分布有正向作用。研究不仅为九寨沟生物圈保护区植被健康诊断提供了第一手科学数据,而且对我国其他生物圈保护区的生态安全遥感监测具有推广价值。
关键词:
Under the intertwined effects of natural processes, geological disasters, and human disturbances, the health risks of vegetation in biosphere reserves have increased. Accurately extracting and identifying vegetation health information from complex large scenes faces technical challenges. This study investigated the Changhai pilot zone of the Jiuzhai Valley biosphere reserve by leveraging the macro, objective, and quantitative advantages of remote sensing technology. It proposed a fine-scale remote sensing monitoring method integrated with feature extraction and random forest for large-scene vegetation health, achieving the information extraction and target identification of unhealthy trees in typical biosphere reserves. The results show that: ① The random forest classification method combined with spectral and texture features can accurately extract unhealthy trees scattered in forests from high-resolution remote sensing images; ② The red-green ratio index, normalized difference vegetation index, correlation between red-edge and red bands, and corrected soil-adjusted vegetation index constitute typical features for extracting vegetation health information from remote sensing images; ③ The Changhai pilot zone exhibits a generally fair vegetation health status, with unhealthy trees accounting for 0.23%, and geological disasters exert positive effects on the spatial distribution of unhealthy trees. This study provides primary scientific data for vegetation health diagnosis of the Jiuzhai Valley biosphere reserve while showing generalization value for the remote sensing monitoring of ecological security in other biosphere reserves of China.
Keywords:
本文引用格式
高昇, 陈富龙, 时丕龙, 周伟, 朱猛, 骆艳松, 杨青霞, 王琴.
GAO Sheng, CHEN Fulong, SHI Pilong, ZHOU Wei, ZHU Meng, LUO Yansong, YANG Qingxia, WANG Qin.
0 引言
1971年,联合国教科文组织启动了“人与生物圈计划”,提出了世界生物圈保护区的概念,旨在保护自然生态系统的同时,进一步发挥生物圈保护区对当地的社会和经济效益[1]。世界生物圈保护区的提出、实践和演变,为可持续发展的研究提供了相关的经验[2]。在生物圈保护区中,植被的作用尤为重要,其作为碳循环过程中重要的一环,可以有效提高陆地的碳汇[3]; 并且植被作为森林生态系统的基石,为其中的动物提供能量和栖息环境,在维持整个生态系统稳定和保护基因库上起着至关重要的作用。因此,在生物圈保护区中进行植被健康监测十分必要。遥感技术具有宏观、客观与定量的优势,可以应用于大场景生物圈保护区进行植被健康的精细化监测。
在特征选取方面,依据植被受胁迫状态下伴随着光合色素含量的下降[15],前期研究倾向使用与光合色素相关的植被指数,例如使用归一化植被指数作为衡量植被健康和绿色的指标[16]、绿色归一化植被指数来监测叶绿素a的浓度变化[17-18],使用归一化差异红边指数来监测红边早期的异常[19]。光合色素含量过低的叶片颜色会变黄或变灰,可使用红绿指数来监测植被颜色外观的变化[7,14-15]。此外,Chen等[20]注意到地物空间布局对植被健康监测的干扰; Wang等[21]使用土壤调整植被指数来减弱土壤亮度对植被影响。除光谱特征外,已有研究表明,使用灰度共生矩阵计算的纹理信息标量可以有效提升识别精度[8,22]。随着对植被病害过程研究深入,遥感大数据浪潮下可选用的影像特征越来越多,因此亟须开展并挖掘表征植被健康的典型特征集。
综上表明,遥感技术在植被健康监测和诊断中具备潜力,然而鲜有研究聚焦于植被健康的特征提取与典型性分析,以及遥感技术在大场景生物圈保护区的精细监测。基于此,本研究以九寨沟世界生物圈保护区为例,对保护区内的长海试验区进行大场景、精细化的植被健康监测,并对特征的典型性以及不健康树木成因进行分析,为及时保护和科学管控生物圈保护区内森林资源提供前沿示范。
1 研究区概况及数据源
1.1 研究区概况
九寨沟生物圈保护区位于四川省阿坝藏族羌族自治州漳扎镇境内,地理坐标为N32°54'~33°19',E103°46'~104°5'。保护区内除了有瀑布、钙化、滩流等景观外,也有多种国家珍稀保护物种,是重要的动植物基因库。九寨沟大部分地区为植被覆盖,在九寨沟进行植被健康监测并及时干预抢救不健康树木,对维持其生态系统稳定具有重要意义。
研究选取九寨沟生物圈保护区内的长海地区进行植被健康监测(图1)。长海集中了九寨沟保护区主要病害树种: 云杉和冷杉,其病害类型为叶锈病和落叶病。根据实地调研,九寨沟生物圈保护区对植被健康的保护工作规范,不健康树木多以单株树木的情形出现,因此研究面临的是大场景、精细化的植被健康遥感监测的技术难题。
图1
1.2 WorldView-2影像及预处理
研究所使用的遥感影像为WorldView-2卫星影像,WorldView-2提供0.5 m的全色波段影像和2 m的多光谱影像,其中多光谱影像一共包含有8个波段。相较于传统的多光谱数据(如IKONOS、资源三号等)只有蓝光波段、绿光波段、红光波段和近红外波段4个波段,WorldView-2还包含额外的海岸波段、黄光波段、红边波段和近红外2波段4个波段。这些额外的波段可以用来构建更多的特征量,更好地反映植被健康状况。利用ENVI5.3软件对WorldView-2影像进行辐射定标、FLAASH大气校正、正射校正和Gram-Schimdt融合,最终得到研究区2 m的多光谱地表反射率影像和0.5 m的多光谱融合地表反射率影像。
1.3 实地数据
图2
图2
健康和不健康云杉与冷杉的光谱曲线对比
Fig.2
Comparison of spectral curves between healthy and unhealthy spruce-fir
图3
图3
卫星影像和无人机影像呈现的病害树木
Fig.3
Disease-impacted trees in WorldView images and UAV image
2 研究方法
针对九寨沟长海地区的实地情况和先前研究存在的不足,本研究提出了一种集特征提取和随机森林的大场景植被健康遥感精细监测方法。具体的技术流程如图4所示。
图4
图4
植被健康监测与分析技术流程
Fig.4
A flowchart of the analysis procedure for vegetation health monitoring
2.1 构建分类模型
2.1.1 光谱特征计算
表1 WorldView-2计算的光谱指数
Tab.1
类型 | 光谱指数 | 计算公式① | 描述 |
---|---|---|---|
归一化植被 指数 | NDVI57 | NDVI57 | 传统用来识别植被的指数,与叶绿素浓度相关 |
NDVI58 | NDVI58 | ||
红绿指数 | RGI34 | RGI34 | 凸显叶片变黄趋势 |
RGI35 | RGI35 | ||
RGI45 | RGI45 | ||
修正的土壤调节植被指数 | MSAVI57 | MSAVI57 | 弱化土壤对植被的影响 |
MSAVI58 | MSAVI58 | ||
绿色归一化植被指数 | GNDVI37 | GNDVI37 | 与叶绿素浓度相关,且对于叶绿素a浓度相比于NDVI更为敏感 |
GNDVI38 | GNDVI38 | ||
归一化差异红边指数 | NDRE67 | NDRE67 | 反映植被受胁迫时早期的红边异常 |
NDRE68 | NDRE68 |
①Green,Yellow,Red,RedEdge,NIR1和NIR2分别为WorldView-2绿光、黄光、红光、红边、近红外1和近红外2波段的反射率。
2.1.2 纹理特征计算
表2 灰度共生矩阵计算的纹路度量
Tab.2
纹理度量 | 计算公式① | 描述 |
---|---|---|
均值MEA | 灰度共生矩阵窗口的灰度均值,反映图像的明暗深浅 | |
相异性DIS | 反映图像灰度的相异性 | |
角二阶矩 | 反映图像灰度分布均匀程度和纹理粗细度 | |
对比度CON | 反映图像的清晰度和纹理的强度深浅 | |
相关性COR | 度量图像的灰度级在行或列方向上的相似程度 | |
反差VAR | 反映图像的局部差异性 | |
同质性HOM | 反映图像纹理的同质性 | |
熵ENT | 图像包含信息量的随机性度量 |
①
2.1.3 随机森林分类器
虽然深度学习在影像分类上所展现的性能越发优秀,但是由于对样本的大量需求,其并不适用于在不健康树木发生率低的地区进行植被健康监测。随机森林作为传统的机器学习算法,同样也被广泛用于植被的健康监测中[23]。
随机森林通过组合多个弱分类器来达到强分类的效果。随机森林中的弱分类器由决策树算法构建,目前常用的树节点构建标准为基尼系数,反映了从训练子集中选取2个样本,其类别标签不一致的概率。基尼系数越小,则样本集纯度越高,因此每个树节点的分裂使用基尼系数下降最多的特征量,直到到达叶子节点。计算公式为:
式中:
研究结合光谱特征和纹理特征构建随机森林分类模型,并确定分类的最佳灰度共生矩阵窗口大小。
2.2 特征提取
2.2.1 特征降维
首先计算特征两两之间的斯皮尔曼相关系数
式中:
根据距离矩阵,对特征集进行离差平方和最小的层次聚类。该聚类的合并准则是最小化每个聚类内的方差距离。在每一次合并过程中,会计算合并后新形成的聚类与其他聚类的距离,然后将距离最小的2个聚类合并成一个新的聚类。通过划定不同的距离阈值,从每个聚类中选取一个保留特征,来重新构建随机森林分类模型,并与之前的模型进行性能对比。
2.2.2 特征重要性计算
研究采用置换重要性作为评判标准,相对于基于不纯度的特征重要性可能出现的偏向问题,置换重要性是无偏的[31]。置换重要性的计算与分类模型无关,它是以特征被随机排列后模型分数的下降程度为评价标准。特征
式中:
在植被健康监测中,重点关注的是对不健康树木的识别,因此使用整个模型的分数作为计算标准是不严谨的。在本研究中,不健康的树木类别设置为正类,计算不同数据集下的分数时,使用正类的F1分数作为评价标准。
2.3 不健康树木识别
把重新构建好的分类模型应用到整个WorldView-2影像,实现整个长海地区不健康树木的精准识别。研究从水平和垂直2个维度对不健康树木的分布进行分析,以确定长海地区不健康树木的空间分布情况。其中,垂直维度计算不同海拔高度下不健康树木的发生概率,并分析其趋势; 水平维度采用最邻近分析,最邻近分析通过计算不健康树木与其最近不健康树木的平均距离
式中:
3 结果与分析
3.1 分类模型的识别精度
研究使用准确率(总样本中预测正确的概率)和召回率(正样本中预测为正的概率)作为识别精度的标准。表3列出了用不同特征构建随机森林分类模型中所得到的不健康树木识别精度。可以看到如果只使用原始8个波段进行分类效果较差,特别是召回率仅有11.3%。进一步在分类器中加入植被指数后,识别的准确率和召回率均有所提高,但是召回率仍然较低。如果加入的是灰度共生矩阵的纹理度量(窗口大小为3),识别精度的变化与加入植被指数时相似。当同时加入植被指数和灰度共生矩阵的纹理度量时,识别的准确率得到了进一步提高,同时召回率也会得到显著提升。由此可见,植被指数所反映的光谱特征和灰度共生矩阵所反映的纹理特征,可以有效改善不健康树木的识别精度。
表3 不同特征加入分类器的识别精度
Tab.3
指标 | 8波段 | 8波段+植 被指数 | 8波段+灰度 共生矩阵 | 8波段+植被指 数+灰度共生矩阵 |
---|---|---|---|---|
准确率 | 53.8 | 77.8 | 84.4 | 92.7 |
召回率 | 11.3 | 22.6 | 43.5 | 61.3 |
F1分数 | 18.7 | 35.0 | 57.4 | 73.8 |
不同窗口大小的灰度共生矩阵所计算的纹理度量有所不同,为了确定最佳的窗口大小,需要分别把不同窗口大小所计算的纹理度量放入分类器中进行比较。图5显示了在不同分辨率下,使用不同灰度共生矩阵窗口大小所得到的识别精度变化趋势。可以看出,灰度共生矩阵窗口大小的变化对不健康树木识别的准确率影响较小,无论在2 m还是0.5 m空间分辨率的影像中,不健康树木识别的准确率均达到90%以上,特别是在0.5 m空间分辨率影像中,准确率几乎接近100%,极少出现误判的情况。在2 m空间分辨率下不健康树木识别准确率稍低的原因是该空间分辨率下每棵树在像素层面具有更大的周长面积比,计算准确率时的分母较小,树冠边界像素的误判更容易造成准确率的下降。灰度共生矩阵窗口大小对不健康树木识别精度的影响主要体现在召回率上: 随着窗口大小的变大,召回率逐渐上升,并在一定窗口大小处达到饱和,随后出现略微下降的趋势。召回率达到饱和时的窗口大小即为不健康树木识别的最佳窗口大小。在2 m空间分辨率下,最佳窗口大小为15; 在0.5 m空间分辨率下,最佳窗口大小为31。在最佳窗口大小下,2 m和0.5 m空间分辨率影像的识别召回率均在87%左右,揭示经过影像融合后得到更高空间分辨率的影像不一定能有效改善分类结果。
图5
3.2 特征典型性分析
研究以2 m空间分辨率、15个像素的灰度共生矩阵窗口大小为例,进行不健康树木识别的特征提取和特征重要性评估。在3.1节中,构建随机森林分类模型中一共使用了83个特征量,首先计算这些特征两两之间的斯皮尔曼相关系数,然后对特征集进行离差平方和最小的层次聚类,构建树状聚类结构(图6)。
图6
根据聚类树状图,划定一个距离阈值,从每一个集群中选择一个保留特征,来完成对特征集的降维处理。表4显示了通过划定不同阈值对特征集降维处理后,新特征集相对于原始特征集的分类能力。以距离0.2为阈值划分特征集,最终提取的24个特征,具有与原始83个特征相当的分类能力。
表4 新特征集的相对分类能力
Tab.4
距离阈值 | 特征 个数 | 准确 率/% | 召回 率/% | F1分 数/% | 相对分类 能力/% |
---|---|---|---|---|---|
2.00 | 4 | 80.0 | 45.2 | 57.7 | 62.5 |
1.30 | 6 | 91.7 | 70.9 | 80.0 | 86.7 |
0.75 | 8 | 94.0 | 75.8 | 83.9 | 90.1 |
0.55 | 12 | 92.7 | 82.3 | 87.2 | 94.4 |
0.45 | 15 | 92.9 | 85.5 | 89.1 | 96.5 |
0.25 | 21 | 96.4 | 85.5 | 90.5 | 98.0 |
0.20 | 24 | 96.4 | 87.1 | 91.5 | 99.1 |
对新特征集的24个特征进行置换重要性的计算,图7显示了重要性大于0.02的特征。可以看到,对于不健康树木的识别,最重要的特征是由WorldView-2影像的绿光波段和红光波段所计算出来的红绿指数,紧随其后的是由红光波段和近红外1波段所计算的归一化植被指数。这2个特征对识别的影响较大,打乱它们会严重影响到分类精度。红边波段、红光波段相关性和修正的土壤调整植被指数的置换重要性接近0.1,这三者对分类的精度影响也是不容忽视的。其他单一特征的置换重要性则较小,主要通过多个特征耦合来对识别效果形成积极的影响。
图7
图7
置换重要性大于0.02的特征
Fig.7
Features with permutation importance greater than 0.02
3.3 植被健康监测
使用特征提取后得到的24个特征,重新构建随机森林分类模型,将该模型应用到整个长海地区的WorldView-2影像进行不健康树木的识别。根据最邻近分析,长海地区的不健康树木平均观测距离
图8
图9
图9
不同高程不健康树木发生概率
Fig.9
Occurrence probability of unhealthy trees at different elevations
4 讨论
4.1 分类模型分析
随着计算机算力、遥感平台的发展,研究者更倾向于使用高光谱影像和深度学习算法。前者通过更多的波段来提供信息量,后者通过更多的样本来提供信息量。而长海试验区地形复杂,难以采集无人机高光谱数据,且长海整体不健康树木发生概率仅有0.23%,不健康树木多以单株形式出现,这2种提供信息量的方法不再适用。本研究的结果则表明,在这种大场景地区的遥感应用中,合理地结合光谱指数和纹理特征,同样也可以有效地提供信息量,来达到精细化的识别效果。
相近波段计算出来的光谱特征和纹理特征存在冗余现象,为了防止冗余现象造成模型计算效率的降低和特征重要性的失真,本研究通过对特征集的降维处理,发现提取出来的24个特征就可以达到与原始特征集相当的分类能力。
为了进一步确定这些特征的分类能力,研究通过对置换重要性的计算,发现传统的2个植被指数——红绿指数和归一化植被指数依旧提供着巨大的信息量,WorldView-2影像所特有的红边波段和修正的土壤调整植被指数也对分类结果有些较大的影响。除了红光波段纹理特征的重要性较大外,其余的纹理特征的重要性均较小,但是它们数量多,且每一个特征都能对分类结果提供正面的影响。这些特征可以作为今后植被健康研究中的优选特征。
4.2 植被健康态势分析
根据实地调研,九寨沟树木的不健康成因有3种: 人为扰动、自然过程和地质灾害(图10)。把长海地区的植被区域划分为人类活动区、野生天然林区和地质灾害区(主要地质灾害为冲沟),计算得到的3类地区不健康树木发生概率如表5所示。在自然状态下,野生天然林的不健康树木发生的概率为0.21%,而在地质灾害发生的区域,不健康树木明显变多,达到了0.40%。这反映出冲沟等地质灾害对长海地区植被有明显的破坏作用。人类活动区的不健康树木发生概率则较低,但考虑到人类活动的林区为人工林,树木长得较为低矮,很多树木的病害特征难以在冠层尺度观察到,故人为扰动的成因与另外2个成因的可比性不强。总的来说,研究对九寨沟生物圈保护区长海地区开展植被健康监测,可以有效识别出不健康的树木,以指导该地区进行森林资源保护。地质灾害对森林有着明显的破坏作用,需要重点对地质灾害区的树木进行抢救,以避免更多树木的死亡。人为扰动所导致不健康树木发生概率相对较低,但考虑到人类活动区树木长势矮小,病害特征难以在冠层上观测到,因此依然需要持续关注人为扰动对植被健康状况的影响。
图10
表5 3种成因的不健康树木发生概率
Tab.5
不健康树木成因 | 林区类型 | 不健康树木发生概率/% |
---|---|---|
人为扰动 | 人工林 | 0.17 |
自然过程 | 天然林 | 0.21 |
地质灾害 | 天然林 | 0.40 |
5 结论
针对植被健康状态保护较好的生物圈保护区,开展大场景、精细化的植被健康监测,提出一种集特征提取和随机森林的大场景植被健康遥感精细监测方法,完成了对九寨沟长海地区不健康树木的精细化识别,该方法对同类型大场景生物圈保护区植被健康监测与诊断具有推广价值。研究结果表明:
1)同时耦合光谱指数特征和灰度共生矩阵纹理特征可以有效提高不健康树木识别的准确率和召回率,且明显高于只使用光谱特征或者只使用纹理特征。
2)改变灰度共生矩阵的窗口大小,可以有效提高不健康树木识别的召回率,但是在窗口大到一定程度后,召回率会趋于饱和,此时的窗口大小为分类的最佳窗口大小。
3)对不健康树木识别最重要的5个特征为: 红绿指数、归一化植被指数、WorldView-2红边波段、红光波段相关性和修正的土壤调整植被指数,这些特征可以作为今后植被健康研究的典型特征。
4)长海地区的地质灾害对树木根系的破坏作用较为严重,地质灾害对不健康树木的驱动作用相对于自然过程提升了接近一倍,地质灾害对该地区的植被健康状况有着明显的消极作用。
参考文献
Action plan for biosphere reserves
[J].
Concept and practice:The case of UNESCO biosphere reserves
[J].
Large Chinese land carbon sink estimated from atmospheric carbon dioxide data
[J].
松材线虫病变色松树遥感监测研究进展
[J].
Progress in remote sensing monitoring for pine wilt disease induced tree mortality:A review
[J].
Assessing very high resolution UAV imagery for monitoring forest health during a simulated disease outbreak
[J].
作物病虫害遥感监测与预测研究进展
[J].
Progress in monitoring and forecasting of crop pests and diseases by remote sensing
[J].
Evaluating methods to detect bark beetle-caused tree mortality using single-date and multi-date Landsat imagery
[J].
Mapping Robinia pseudoacacia forest health conditions by using combined spectral,spatial,and textural information extracted from IKONOS imagery and random forest classifier
[J].
Evaluating the potential of WorldView-2 data to classify tree species and different levels of ash mortality
[J].
Using UAV-based photogrammetry and hyperspectral imaging for mapping bark beetle damage at tree-level
[J].
Early detection of pine wilt disease using deep learning algorithms and UAV-based multispectral imagery
[J].
Fusion of UAV hyperspectral imaging and LiDAR for the early detection of EAB stress in ash and a new EAB detection index—NDVI(776,678)
[J].
基于Sentinel-1多时相InSAR影像的云南松切梢小蠹危害程度监测
[J].
Using Sentinel-1 multi-temporal InSAR data to monitor the damage degree of shoot beetle in Yunnan pine forest
[J].
Integrating multi-sensor remote sensing and species distribution modeling to map the spread of emerging forest disease and tree mortality
[J].
Surveying mountain pine beetle damage of forests:A review of remote sensing opportunities
[J].
Monitoring vegetation systems in the Great Plains with ERTS
[J].
Use of a green channel in remote sensing of global vegetation from EOS-MODIS
[J].
A random forest model for the classification of wheat and rye leaf rust symptoms based on pure spectra at leaf scale
[J].
Broadband,red-edge information from satellites improves early stress detection in a New Mexico conifer woodland
[J].
Assessing the impact of emerging forest disease on wildfire using Landsat and KOMPSAT-2 data
[J].
Dynamic analysis of Robinia pseudoacacia forest health levels from 1995 to 2013 in the Yellow River Delta,China using multitemporal Landsat imagery
[J].
Tree species classification in tropical forests using visible to shortwave infrared WorldView-3 images and texture analysis
[J].
Remotely piloted aircraft systems to identify pests and diseases in forest species:The global state of the art and future challenges
[J].
UAV multispectral imagery can complement satellite data for monitoring forest health
[J].
Machine learning in agriculture:A review
[J].
Multichannel object detection for detecting suspected trees with pine wilt disease using multispectral drone imagery
[J].
UAV remote sensing monitoring of pine forest diseases based on improved Mask R-CNN
[J].
Detection of standing dead trees after pine wilt disease outbreak with airborne remote sensing imagery by multi-scale spatial attention deep learning and Gaussian kernel approach
[J].
Detection of tree decline (Pinus pinaster Aiton) in European forests using Sentinel-2 data
[J].
Textural features for image classification
[J].
An AUC-based permutation variable importance measure for random forests
[J].
DOI:10.1186/1471-2105-14-119
PMID:23560875
[本文引用: 1]
Background: The random forest (RF) method is a commonly used tool for classification with high dimensional data as well as for ranking candidate predictors based on the so-called random forest variable importance measures (VIMs). However the classification performance of RF is known to be suboptimal in case of strongly unbalanced data, i.e. data where response class sizes differ considerably. Suggestions were made to obtain better classification performance based either on sampling procedures or on cost sensitivity analyses. However to our knowledge the performance of the VIMs has not yet been examined in the case of unbalanced response classes. In this paper we explore the performance of the permutation VIM for unbalanced data settings and introduce an alternative permutation VIM based on the area under the curve (AUC) that is expected to be more robust towards class imbalance.;Results: We investigated the performance of the standard permutation VIM and of our novel AUC-based permutation VIM for different class imbalance levels using simulated data and real data. The results suggest that the new AUC-based permutation VIM outperforms the standard permutation VIM for unbalanced data settings while both permutation VIMs have equal performance for balanced data settings.;Conclusions: The standard permutation VIM loses its ability to discriminate between associated predictors and predictors not associated with the response for increasing class imbalance. It is outperformed by our new AUC-based permutation VIM for unbalanced data settings, while the performance of both VIMs is very similar in the case of balanced classes. The new AUC-based VIM is implemented in the R package party for the unbiased RF variant based on conditional inference trees. The codes implementing our study are available from the companion website: http://www.ibe.med.uni-muenchen.de/organisation/mitarbeiter/070_drittmittel/janitza/index.html.
/
〈 |
|
〉 |
