采用随机森林法的天绘数据干旱区城市土地覆盖分类
田绍鸿, 张显峰
北京大学遥感与地理信息系统研究所,北京 100871
通讯作者:张显峰(1967-),男,副教授,主要从事生态遥感、高光谱遥感数据智能处理与分析、遥感数据同化模拟等方面的研究。Email:xfzhang@pku.edu.cn

第一作者简介: 田绍鸿(1991-),男,硕士研究生,主要从事生态遥感、遥感数据智能处理与分析等方面的研究。Email:shaohongtian@pku.edu.cn

摘要

基于天绘一号(TH-1,或称MS-1)卫星多光谱数据,采用随机森林分类方法(random forests classification,RFC)对位于中亚干旱区的我国新疆维吾尔族自治区阿勒泰地区北屯市及周边区域的土地覆盖进行了分类研究。针对北屯市不透水层与裸土混杂的情况,将纹理特征与植被信息构建最优组合,建立有效的RFC分类器,提高对易混淆土地覆盖类型的分类识别精度。结果表明,采用RFC的分类精度高于最大似然法分类结果,总体分类精度提高了近10%。经过优化选择的特征组合在对干旱区中小城市土地覆盖进行分类时表现良好,能得到较高精度的分类结果,可满足新疆中小城市发展规划对土地覆盖信息的需求。

关键词: 天绘一号(TH-1); 随机森林; 特征选择; 土地覆盖分类; 干旱区
文献标志码:A 文章编号:1001-070X(2016)01-0043-07 doi: 10.6046/gtzyyg.2016.01.07
Random forest classification of land cover information of urban areas in arid regions based on TH-1 data
TIAN Shaohong, ZHANG Xianfeng
Institute of Remote Sensing and GIS, Peking University, Beijing 100871, China
Abstract

Random-forest classification(RFC)method was used to extract the land cover information from the TH-1 satellite remotely sensed multispectral data in Beitun Town and its adjacent areas within the arid region of Altay,Xinjiang. Owing to the mixture of the impervious covers and the exposed soils inside the city, the textural and vegetation features were derived from the TH-1 panchromatic image and multispectral bands and subsequently applied to creating optimal feature set so as to implement the RFC classification. The optimized classifier can achieve better identification of some confused land cover classes. The results show that the RFC possesses higher accuracy than the conventional maximum likelihood classification(MLC)with the same TH-1 image, with their total accuracy being 82.26% and 72.61%, respectively. In addition, favorable applicability is observed in the land cover classification in the arid urban region using optimized combined multi-feature methods, which can provide land cover information for the urban development and planning in the medium and small cities of Xinjiang.

Keyword: TH-1; random forests; feature selection; land-cover classification; arid regions
0 引言

我国中西部地区的城市大多位于干旱半干旱区域, 受地形等自然因素的影响, 城市的轮廓特征以及城市类群的分布都不十分规则[1]。采用遥感技术对中西部干旱区的城市区域土地覆盖进行监测是一种低成本、高效率的手段。最大似然分类法(maximum likelihood classification, MLC)被认为是稳定性较好的统计分类器[2], 如果图像数据在特征空间中的分布较复杂、离散或训练样本不具代表性, 可能会造成统计结果与实际分布的偏差较大、分类精度下降。许多学者提出了MLC的改进算法[2, 3]以及基于支持向量机(support vector machines, SVM)理论和人工神经网络(artificial neural network, ANN)模型的分类方法[4, 5, 6, 7], 取得了很好的分类效果。然而, 传统的基于统计和非统计的分类算法对地物类型的划分都只进行单次决策, 其分类结果受遥感图像噪声干扰以及“ 同物异谱” 、“ 同谱异物” 现象的存在会出现较多的错分、漏分现象, 导致分类精度不高。为解决上述问题, 集成学习与多分类器系统被引入遥感土地覆盖分类研究中, 并在理论上被证明比单一分类器得到的分类结果更好[8]。其中, Breiman[9]提出的随机森林分类(random forests classification, RFC)是目前有效的分类器集成策略, 该方法对噪声具有较强的容忍度和较低的泛化误差[10]。研究表明, RFC方法非常适合于土地覆盖分类[11], 在对Landsat TM/ETM+多光谱图像数据、高光谱航空遥感数据、机载LiDAR数据等进行土地覆盖分类的研究中, RFC方法都取得了较好的分类效果[12, 13, 14, 15]。目前国内仅有少数学者将RFC方法应用于遥感图像分类[16, 17, 18], 但针对快速发展的我国中西部城市区域基于RFC的土地覆盖分类研究尚不多见。

本文基于天绘一号(TH-1, 或称MS-1)卫星多光谱数据, 针对干旱区城市区域土地覆盖分类的特点, 利用RFC方法, 通过特征选择与优化, 建立基于RFC的新疆维吾尔自治区北屯市土地覆盖分类方法, 探索适合干旱区城市区域土地覆盖分类的方法, 旨在为新疆城市化发展规划提供土地覆盖信息, 并进一步推进TH-1卫星图像的应用。

1 研究区与数据源
1.1 研究区概况

新疆维吾尔自治区北屯市(E 87° 45'14.2″~87° 51'31.5″, N 47° 18'37.8″~47° 22'58.7″)地处阿尔泰山南麓、准噶尔盆地北缘, 毗邻阿勒泰市和福海县; 属温带大陆性气候, 年平均气温3.6~3.9℃, 干旱少雨; 主要地貌类型为平原和河流, 市区沿著名的额尔齐斯河东西向延伸; 地势较平坦, 光照充足, 农牧业生产条件较好, 土地开发潜力较大。

该区域土地覆盖分类的难点主要在于: ①空间异质性强。在景观上, 干旱区的城市多为近邻水资源的人工绿洲, 形成了在大范围荒漠草地、戈壁沙漠之中镶嵌的人工绿洲异质体。在遥感图像中, 即使同一类覆盖类型也会呈现出不一致的光谱特征, 即“ 同物异谱” 现象, 这一现象一旦出现将给遥感分类增加很大难度; ②不透水层与透水层混合。在干旱区, 城市的景观格局分布分散, 城市规模小, 城市中的不透水层覆盖过重会影响地下水的补充, 因此位于干旱区的城市区域呈现不透水层和透水层混合分布的状况。干旱区土壤含水量较低, 盐碱化严重, 存在难以区分裸露土壤与不透水层的情况, 也会给遥感分类带来困难; ③水体水位变异大。因河流多为季节河, 水位变化大, 往往导致水体轮廓点不能用作几何纠正的参考点, 这给水体/水系的分类带来了难度; ④裸土光谱差异大。人工绿洲的耕地中, 土壤经人工改造有机质含量丰富, 土壤矿物如氧化铁等含量高, 会导致土壤在可见光波段范围出现多个异常的吸收特征[19]。如沙漠结皮往往表现出一定的植被特性或低反射特性, 在多光谱遥感图像中易被识别为植被或湿润土壤甚至水体。干旱区土地覆盖的以上特点, 导致了传统的遥感分类法难以取得令人满意的结果; 而在训练样本不全、噪声干扰强以及地物光谱特征不显著的情况下, 引入机器学习的模式识别机制和集成学习的投票策略是提高干旱区土地覆盖分类精度的有效手段。

1.2 数据源及其预处理

本文使用的遥感数据是天绘一号(TH-1, 或称MS-1)卫星多光谱图像, 获取时间为2013年9月26日, 包括4个空间分辨率为10 m的多光谱波段和空间分辨率为2 m的全色波段数据。该图像覆盖了北屯市市区及其周边部分区域。对数据进行辐射校正和几何纠正等预处理, 得到待分类的TH-1图像。

研究使用的参考数据是以研究区土地利用调查数据及QuickBird数据为基准绘制的北屯市及周边土地覆盖类型图。对所得结果通过地面采样点进行验证, 用于对土地覆盖类型分类精度的比较分析。

2 随机森林分类方法
2.1 RFC的原理

随机森林分类是以决策树为基本分类器的一个集成学习模型[20, 21]。单个决策树在数据复杂或存在噪声干扰情况下, 得到的分类规则容易出现“ 过拟合” , 致使泛化误差增大, 造成对总体样本的分类精度下降; 而RFC包含多个通过训练样本集成学习得到的决策树, 从而较好地克服了单个决策树的过拟合问题。RFC对噪声和异常值的容忍性较好, 已被广泛应用于各类数据的分类[22]

RFC模型中的每个决策树根据训练集和随机向量θ k生成, 最终组成的决策树集合就是RFC模型{h(X, θ k), k=1, 2, …K}, 其中X是输入变量。每一个决策树模型h(X, θ k)都有一票投票权用于选择输入变量X的分类结果。经过K轮训练, 可根据训练集得到一个分类模型序列{h1(X), h2(X), …, hk(X)}, 也就形成了RFC模型。对样本集的分类结果则由每个分类模型的分类结果通过投票决定, 即

H(X)=maxY i=1kI(hi(X)=Y) , (1)

式中: H(X)为RFC模型; hi(X)为单个决策树分类模型; X为输入变量; Y为目标变量(或分类目标); I(· )为示性函数。RFC模型使用简单的投票策略来完成最终的分类(图1)。

图1 随机森林分类过程示意图Fig.1 Flowchart for RFC process

RFC方法具有泛化误差收敛和袋外估计无偏性2个特性。

1)泛化误差收敛。根据RFC分类模型序列{h1(X), h2(X), …, hk(X)}定义模型的余量函数为

mr(X, Y)=avkI[h(X, θ k)=Y]-maxjYavkI[h(X, θ k)=j] , (2)

式中: mr(X, Y)为余量函数; avk(· )为均值运算; h(X, θ k)为分类模型序列。余量函数反映了输入样本X的正确分类Y的得票数高于错误分类得票最多类别的程度, 因此余量函数越大, RFC模型的置信度越高。

定义RFC的泛化误差为PE* =PX, Y[mr(X, Y)< 0]。Breiman[9]证明, 随着决策树分类模型数目的增加, RFC模型的泛化误差PE* 收敛于PX, Y[Pθ (h(X, θ k)=Y)-maxjYPθ (h(X, θ k)=j)< 0], 模型的收敛性表明随着决策树数目的增加, 模型不会产生过度拟合的问题。对泛化误差PE* 的上界进行估计, 若定义RFC模型中单个决策树的分类强度为s, 决策树之间的相关性为 ρ̅, 则

s=EX, Y[mr(X, Y)] , (3)

ρ̅=Eθi, θj[ρ(θi, θj)sd(θi)sd(θj)]Eθi, θj[sd(θi)sd(θj)]。 (4)

式中: E(· )与sd(· )分别表示数学期望与标准差。Breiman[9]证明了RFC模型的泛化误差上界为

PE* ρ̅(1-s2)s2。 (5)

式(5)表明, RFC模型的泛化误差上界与单个决策树的分类强度s呈负相关, 与决策树之间的相关性 ρ̅呈正相关。因此, 在提高单个决策树分类强度的同时降低决策树之间的相关性, 即可减小RFC模型的泛化误差上界, 使分类结果更准确[23]

2)袋外估计无偏性。从原始样本集中随机取样时, 约有37%的样本不会被选中, 这一部分未被选中的袋外数据(out-of-bag, OOB)可用于估计组合树模型的泛化误差、分类强度和相关系数; 对于每一个决策树都可以使用OOB得到一个误差估计, 将RFC中所有决策树的OOB误差估计取平均值, 可以评估RFC模型的泛化误差。Breiman[9]通过实验证明, OOB误差估计是无偏的。RFC模型各个决策树的建立是并行的, 可在构建各个决策树的同时对OOB误差进行计算, 故通过少量计算即可在短时间内完成模型的误差估计, 减少计算量。Breiman根据Wolpert等[24]对装袋预测泛化误差方法的研究, 证明了袋外估计与使用全样本集进行测试得到误差估计具有相同的精度。OOB估计的无偏性在很大程度上提高了RFC模型的运行效率, 也为分类结果的精度验证提供了理论依据。

2.2 基于RFC的土地覆盖分类

2.2.1 分类体系的确定

在TH-1卫星图像上研究区可清晰识别出的典型地表覆盖类型有荒地(如沙地)、林地、草地、河流、河漫滩、建筑、道路、绿化带、耕地、湖泊以及硬化地面(如水泥地等)。参考《GBT_21010— 2007土地利用现状分类标准》, 结合研究区遥感图像以及干旱区土地覆盖遥感分类的特点, 确定分类体系为: 小麦田(011)、玉米地(012)、稀林地(021)、荒漠草地(031)、建筑(041)、道路(051)、水体(061)以及其他用地(071)。

2.2.2 RFC分类的实现

基于RFC的原理, 根据目标数据选择训练样本, 通过对训练区中样本数据的分析建立分类决策规则或判别函数, 根据确定的8个类别选取响应的训练区。RFC的实现基于ENVI/IDL软件, 采用怀卡托智能分析环境(Waikato environment for knowledge analysis, WEKA)开展分类研究。根据研究区TH-1图像中主要地表覆盖类型的光谱及空间分布特征的分析, 为提高组合决策树的分类精度, 在TH-1原始4个多光谱波段数据的基础上纳入全色波段信息、植被指数信息和纹理特征信息, 构建了多个特征数据集, 依次对各特征的有效性进行评价与分析, 以选取最优化的分类特征集。

3 结果与分析
3.1 选取最优分类特征集

TH-1遥感图像全色波段的星下空间分辨率为2 m, 包含地物大量的结构与纹理特征信息。将全色波段、从全色波段提取的纹理以及4个多光谱波段构成分类特征集; 在此基础上, 进行特征的有效性检验, 构成优化后的分类特征子集。

3.1.1 加入纹理特征

在研究区, 建筑和道路都具有类似水泥表面的光谱特征, 这也是传统的分类方法难以将二者准确分开的原因。根据建筑的排列特点, 密集低矮的楼群在遥感影像上表现出良好的纹理特征, 因此将纹理特征作为参数引入分类器, 可有效改善分类结果(表1)。

表1 基于纹理特征的样本分类精度 Tab.1 Classification accuracy with texture feature(%)

表1可见, 加入纹理特征后建筑的分类精度提高了约20%, 在分类中纹理能有效地判别城市中非建筑硬化地表(其他用地的一部分, 纹理特征不明显)和建筑用地(纹理特征明显)。北屯市区建筑高度较低, 其光谱特征受地面背景的影响较大, 在没有纹理特征的数据中, 建筑容易被错分为其他用地; 加入纹理特征后, 对建筑的分类效果明显提高。建筑用地的纹理信息与其他覆盖类型有明显的区别, 在决策树节点分裂时, 依靠纹理特征分裂的节点能保证含有建筑用地的节点拥有较高的纯度, 在对建筑用地的判定时表现出较高的准确性。

3.1.2 利用植被信息

归一化差值植被指数(normalized difference vegetation index, NDVI)被广泛应用于监测植被生长状态、植被覆盖度等领域, 能有效地反映植物冠层的背景影响(如土壤、雪盖等)。差值植被指数(difference vegetation index, DVI)为近红外波段(NIR)的反射率与红光波段(R)的反射率之差, 与NDVI相比, DVI对高植被覆盖区域的敏感性更强; 但因DVI没有进行数值归一化, 故对植被覆盖类型的聚类较差。研究区NDVI分布在0~0.47之间, 而DVI分布在0.88~117之间。对待分类数据中的上述2个植被指数按照稀林地、玉米地、荒漠草地、小麦田等4种植被覆盖类型进行统计, 得到4种植被覆盖类型对应的NDVIDVI: 稀林地NDVI为0.27~0.47, DVI为40~117; 玉米地NDVI为0.15~0.28, DVI为20~52; 荒漠草地NDVI为0.06~0.22, DVI为12~29; 小麦田的NDVI为0.03~0.12, DVI为6~22。

研究区在TH-1图像获取时小麦已基本收割完毕, 田中主要剩余秸秆; 荒漠草地为该区域主要的天然植被覆盖, 盖度较低; 而玉米地和稀林地的植被覆盖度较高, 由于NDVI对低植被覆盖较敏感而DVI对较高植被覆盖的区分效果更好, 故理论上引入这2种植被指数可以提高分类的准确度。对检验样本进行精度检验, 以分析2个植被指数特征对各类地表覆盖分类情况的影响(表2)。

表2 加入植被指数后的样本分类精度 Tab.2 Classification accuracy with vegetation indices(%)

植被指数对植被覆盖的分类精度影响较大, 对非植被覆盖(如建筑、道路等)影响小。其中, NDVI对4类植被覆盖的分类精度都提高了约5%~7%; 相比之下, DVI对高覆盖植被类型的分类精度影响更大。4种植被覆盖类型在植被指数上有明显差异, 对于植被覆盖较高的林地和玉米地, DVI的区分更明显, 增加了分类的准确性; NDVI对低植被覆盖的小麦田和荒漠草地判别效果更好, 并对植被和非植被的区分起到很大作用。

3.1.3 优化选择纹理特征

为探索干旱区城市区域土地覆盖类型分类的适宜方法, 分别对全色波段基于灰度共生矩阵计算生成的方差、对比度、相异性和信息熵4种纹理进行了分类实验, 并对分类结果进行了检验。结果表明, 方差纹理的分类精度最高, 4种纹理类型对分类结果的影响差异并不明显, 最低的相异性纹理只比方差纹理低约1.5%。进一步选用了不同的原始数据进行实验, 分别是全色波段数据、大气衰减效应较低的红光波段数据以及经过主成分变换后包含主要亮度信息的第一主成分和包含主要结构信息的第二主成分数据。经过对分类结果的精度检验, 由全色波段数据计算产生的方差纹理在4种数据中的分类精度最高, 其次为红光波段; 对比2个主成分信息的分类结果, 使用第二主成分的分类效果好于第一主成分, 表明第一主成分数据中包含过于集中的各种信息反而压抑了纹理特征的表达, 相比之下第二主成分数据生成的纹理信息更为有效, 但总体来说2个主成分信息对4种地物的分类精度影响很小, 仅在1%左右。

由于纹理特征对分类结果的影响主要表现在对建筑用地和其他用地错分的纠正, 而TH-1图像中建筑用地的纹理特征较明显, 从而会优化对这2类地物覆盖类型的判别, 所以纹理特征对最后分类的总体精度影响并不十分明显。经比较认为使用全色波段数据计算的方差纹理得到的分类效果最好。

3.2 分类精度评价

在传统的分类方法中, 基于统计模式识别原理的MLC是最常用且分类结果稳定性较好的分类器, 在样本数增多时分类效果的收敛性好, 运算速度也较快, 因此在遥感图像分类上得到了广泛的应用[25]。本文分别利用MLC和RFC对北屯市的TH-1图像数据进行了分类实验(图2)。分类特征集由上述优化选择的4个多光谱波段+全色波段+方差纹理+NDVI+DVI构成。结果表明, RFC与MLC对训练样本的分类精度分别为99.97%和71.36%, Kappa分别为0.99和0.66。

图2 RFC与MLC分类结果比较Fig.2 Comparison between classification results with RFC and MLC

训练样本用于机器学习从而产生分类模型, 所以上述结果表明了RFC模型的有效性, 并且可以看出组合树投票决策策略优于传统MLC的决策策略。为进一步评价分类效果, 还利用独立的检验样本对分类结果进行了精度评价, RFC和MLC的分类精度分别为82.26%和72.61%, Kappa系数分别为0.80和0.69。用RFC方法得到的分类结果的准确性比MLC方法提高了约10%。这表明RFC方法具有更低的泛化误差, 分类性能更好, 可靠性更高。比较2种分类结果混淆矩阵中的分类误差与精度, 除了对水体的分类二者差异不大外, 对其他地表覆盖类型RFC的分类结果都优于MLC方法。其中, RFC方法对其他用地这种光谱特征噪声较大的地表覆盖类型分类误差下降了约20%; RFC方法有效地利用纹理特征使建筑、道路等易错分的土地覆盖类型都有很好的分类效果; RFC方法对高植被覆盖类型的分类效果明显高于MLC方法, 使稀林地、玉米地等的分类误差下降了15%左右。对植被覆盖分类起主要作用的特征为多光谱特征和植被指数特征, 在多维向量空间中, 基于组合决策树的判别策略能使特征空间产生较好的分割; 而MLC方法则效果不好, 错分、漏分的现象较多(表3)。

表3 MLC与RFC混淆矩阵比较 Tab.3 Comparison between confusion matrixes of MLC and RFC classifications(%)

综上所述, RFC方法对北屯市TH-1图像的分类结果明显优于传统的MLC方法。根据OOB误差估计理论, 通过对训练样本和检验样本的精度分析, 验证了RFC方法的误差较MLC方法要小, 分类结果更加可靠。北屯市位于干旱区, 无论是建筑用地、绿化用地还是农业用地受土壤背景的影响都比较明显, 会干扰TH-1图像对城市区域的分类。研究表明, RFC方法较强的抗图像噪声能力, 结合纹理信息和植被信息, 可较好识别新疆中小城镇不透水层与土壤, 并且在对训练样本有很高分类精度的情况下, 检验样本仍然具有较高的分类精度, 体现了RFC方法在处理“ 过拟合” 问题上的优良性能。

4 结论

本文基于天绘一号(TH-1)卫星遥感数据和随机森林分类(RFC)算法, 对新疆阿勒泰地区北屯市及周边区域土地覆盖进行了分类研究。针对干旱区中小城市区域土地覆盖的特点, 引入纹理特征与植被指数来构建优化特征集, 建立了针对北屯市土地覆盖类型的RFC方法。结果表明: 使用TH-1数据, 通过RFC分类, 能较好地得到北屯市区的土地覆盖类型结果, 经与参考数据对比较析, 分类精度达到80%以上, 证明了TH-1数据对干旱区土地覆盖类型分类的适用性; 与传统的最大似然分类方法相比, RFC方法的分类精度提高了10%左右, 能更好地提取北屯市及周边区域的土地覆盖信息。本研究所构建的TH-1数据分类最优特征组合中, 全色波段纹理特征对建筑的提取发挥了重要作用; NDVI和DVI对减少植被覆盖与非植被覆盖以及不同植被覆盖度地表类型之间的分类误差有一定作用, 优化选择后的分类特征组合能较好地完成对研究区土地覆盖的分类。

虽然RFC分类相对于MLC有较高的分类精度, 但对有相近光谱特性的地物进行分类时, 仍然出现了一些错分现象。为进一步提高分类精度, 未来的研究应着重在优化决策树结构与引入模糊数学方法来改进RFC算法; 同时考虑到干旱区植被和水体的季节变化比较大, 还应利用多季相遥感数据进行分类, 以进一步提高分类精度。

The authors have declared that no competing interests exist.

参考文献
[1] 董锁成, 王传胜, 尤飞, . 中国西部经济社会地域分异规律研究[J]. 地理研究, 2002, 21(4): 399-406.
Dong S C, Wang C S, You F, et al. On the laws of territorial differentiation of socio-economic development in western China[J]. Geographical Research, 2002, 21(4): 399-406. [本文引用:1]
[2] 骆剑承, 王钦敏, 马江洪, . 遥感图像最大似然分类方法的EM改进算法[J]. 测绘学报, 2002, 31(3): 234-239.
Luo J C, Wang Q M, Ma J H, et al. The EM-based maximum likelihood classifier for remotely sensed data[J]. Acta Geodaetica et Cartographica Sinica, 2002, 31(3): 234-239. [本文引用:2]
[3] Ediriwickrema J, Khorram S. Hierarchical maximum-likelihood classification for improved accuracies[J]. IEEE Transactions on Geoscience and Remote Sensing, 1997, 35(4): 810-816. [本文引用:1]
[4] 谭琨, 杜培军. 基于支持向量机的高光谱遥感图像分类[J]. 红外与毫米波学报, 2008, 27(2): 123-128.
Tan K, Du P J. Hyperspectral remote sensing image classification based on support vector machine[J]. Journal of Infrared and Millimeter Waves, 2008, 27(2): 123-128. [本文引用:1]
[5] 毛建旭, 王耀南. 基于神经网络的遥感图像分类[J]. 测控技术, 2001, 20(5): 29-30.
Mao J X, Wang Y N. Remote sensing image classification based on neural network[J]. Measurement and Control Technology, 2001, 20(5): 29-30. [本文引用:1]
[6] 李强, 王正志. 基于人工神经网络和经验知识的遥感信息分类综合方法[J]. 自动化学报, 2000, 26(2): 233-239.
Li Q, Wang Z Z. Remote sensing information classification based on artificial neural network and knowledge[J]. Acta Automatica Sinica, 2000, 26(2): 233-239. [本文引用:1]
[7] 王耀南. 小波神经网络的遥感图像分类[J]. 中国图象图形学报, 1999, 4(5): 368-371.
Wang Y N. A classification of remote sensing image using wavelet neural network[J]. Journal of Image and Graphics, 1999, 4(5): 368-371. [本文引用:1]
[8] Giacinto G, Roli F. An approach to the automatic design of multiple classifier systems[J]. Pattern Recognition Letters, 2001, 22(1): 25-33. [本文引用:1]
[9] Breiman L. Rand om forests[J]. Machine Learning, 2001, 45(1): 5-32. [本文引用:4]
[10] Rodríguez-Galiano V F, Abarca-Hernández F, Ghimire B, et al. Incorporating spatial variability measures in land -cover classification using Rand om Forest[J]. Procedia Environmental Sciences, 2011, 3: 44-49. [本文引用:1]
[11] Gislason P O, Benediktsson J A, Sveinsson J R. Rand om forests for land cover classification[J]. Pattern Recognition Letters, 2006, 27(4): 294-300. [本文引用:1]
[12] Ham J, Chen Y C, Crawford M M, et al. Investigation of the rand om forest framework for classification of hyperspectral data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(3): 492-501. [本文引用:1]
[13] Chan J C W, Paelinckx D. Evaluation of rand om forest and adaboost tree-based ensemble classification and spectral band selection for ecotope mapping using airborne hyperspectral imagery[J]. Remote Sensing of Environment, 2008, 112(6): 2999-3011. [本文引用:1]
[14] Guo L, Chehata N, Mallet C, et al. Relevance of airborne LiDARand multispectral image data for urban scene classification using Rand om Forests[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2011, 66(1): 56-66. [本文引用:1]
[15] Yuan F, Sawaya K E, Loeffelholz B C, et al. Land cover classification and change analysis of the Twin Cities(Minnesota) Metropolitan area by multitemporal Land sat remote sensing[J]. Remote sensing of Environment, 2005, 98(2/3): 317-328. [本文引用:1]
[16] 刘毅, 杜培军, 郑辉, . 基于随机森林的国产小卫星遥感影像分类研究[J]. 测绘科学, 2012, 37(4): 194-196.
Liu Y, Du P J, Zheng H, et al. Classification of China small satellite remote sensing image based on rand om forests[J]. Science of Surveying and Mapping, 2012, 37(4): 194-196. [本文引用:1]
[17] 杨耘, 徐丽, 颜佩丽. 条件随机场框架下基于随机森林的城市土地利用/覆盖遥感分类[J]. 国土资源遥感, 2014, 26(4): 51-55. doi: DOI: 106046/gtzyyg. 2014. 04. 09.
Yang Y, Xu L, Yan P L. Urban land use/cover classification of remote sensing using rand om forests under the framework of conditional rand om fields[J]. Remote Sensing for Land and Resources, 2014, 26(4): 51-55. doi: DOI:10.6046/gtzyyg.2014.04.09. [本文引用:1]
[18] 张修远, 刘修国. 基于随机森林算法的高维模糊分类研究[J]. 国土资源遥感, 2014, 26(2): 87-92. doi: DOI: 106046/gtzyyg. 2014. 02. 15.
Zhang X Y, Liu X G. Study of high-dimensional fuzzy classification based on rand om forest algorithm[J]. Remote Sensing for Land and Resources, 2014, 26(2): 87-92. doi: DOI:10.6046/gtzyyg.2014.02.15. [本文引用:1]
[19] 魏娜, 姚艳敏, 陈佑启. 高光谱遥感土壤质量信息监测研究进展[J]. 中国农学通报, 2008, 24(10): 491-496.
Wei N, Yao Y M, Chen Y Q. The advance of soil quality information monitoring by hyperspectral remote sensing[J]. Chinese Agricultural Science Bulletin, 2008, 24(10): 491-496. [本文引用:1]
[20] Breiman L. Bagging predictors[J]. Machine Learning, 1996, 24(2): 123-140. [本文引用:1]
[21] Ho T K. The rand om subspace method for constructing decision forests[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(8): 832-844. [本文引用:1]
[22] 方匡南, 吴见彬, 朱建平, . 随机森林方法研究综述[J]. 统计与信息论坛, 2012, 26(3): 32-38.
Fang K N, Wu J B, Zhu J P, et al. A review of technologies on rand om forests[J]. Statistics and Information Forum, 2012, 26(3): 32-38. [本文引用:1]
[23] 董师师, 黄哲学. 随机森林理论浅析[J]. 集成技术, 2013, 2(1): 1-7.
Dong S S, Huang Z X. A brief theoretical overview of rand om forests[J]. Journal of Integration Technology, 2013, 2(1): 1-7. [本文引用:1]
[24] Wolpert D H, Macready W G. An efficient method to estimate bagging’s generalization error[J]. Machine Learning, 1999, 35(1): 41-55. [本文引用:1]
[25] Otukei J R, Blaschke T. Land cover change assessment using decision trees, support vector machines and maximum likelihood classification algorithms[J]. International Journal of Applied Earth Observation and Geoinformation, 2010, 12(1): 27-31. [本文引用:1]