机载LiDAR在红树林林分平均高估算中的应用
Application of airborne LiDAR in the estimation of the mean height of mangrove stand
通讯作者: 田义超(1986-),男,博士,副教授,主要从事资源环境遥感及海岸带生态环境监测研究。Email:tianyichao1314@yeah.net。
责任编辑: 陈理
收稿日期: 2021-07-28 修回日期: 2021-10-19
基金资助: |
|
Received: 2021-07-28 Revised: 2021-10-19
作者简介 About authors
邓静雯(1999-),女,学士,主要从事遥感信息应用研究。Email:
构建基于激光雷达(light detection and ranging,LiDAR)数据的林分平均高反演模型可为无瓣海桑长势的动态监测提供技术支撑。以北部湾茅尾海无瓣海桑红树林湿地为对象,基于机载LiDAR提取的高度和强度参数变量,借助决定系数R2、均方根误差RMSE、赤池信息准则AIC和贝叶斯信息准则BIC指标对随机森林、支持向量机以及神经网络3种模型进行了优选,在最优模型的支持下估算了研究区的红树林平均高及其空间分布状况。结果表明,研究区无瓣海桑的林分平均高介于3.90~11.58 m之间,其中树高较高、胸径较大的无瓣海桑主要分布在潮沟附近以及研究区中部。在估算无瓣海桑的林分平均高时,贡献率最大的是样方点云高度最大值,其次是75%~99%分位数高度。随机森林回归模型在估测林分平均高模型中的精度最高(R2=0.938 1,RMSE=0.58 m,AIC=80.50和BIC=49.05); 支持向量机模型次之,该模型在测试阶段的R2为0.766 5,RMSE为1.27 m; 神经网络模型的拟合效果最差。总体而言,随机森林模型是研究区无瓣海桑林分平均高反演的最优模型。
关键词:
This study constructed a stand mean height inversion model based on LiDAR data, aiming to provide dynamic monitoring of the growth of Sonneratia apetala. Taking the mangrove wetland of Sonneratia apetala in the Maowei Sea of Beibu Gulf as the study object and based on the height and intensity parameters extracted using airborne LiDAR data, this study compared three models, namely random forest, support vector machine, and neural network, based on the coefficient of determination (R2), root mean square error (RMSE), Akachi information criterion (AIC), and Bayesian information criterion (BIC) and then estimated the mean height and spatial distribution of Mangrove in the study area using the optimal model. The results are as follows. The stand mean height of Sonneratia apetala in the study area is 3.90~11.58 m, and Sonneratia apetala with a higher tree height and a larger diameter at breast height is mainly distributed near the tidal trench and the middle part of the study area. In the estimation of the stand mean height of Sonneratia apetala, the maximum percentile height (hmax) had the highest contribution rate, followed by 75%~99% percentile height. The random forest regression model yielded the highest precision (R2=0.938 1,RMSE=0.58 m,AIC=80.50, and BIC=49.05), followed by the support vector machine model (R2 = 0.766 5 and RMSE = 1.27 m in the test stage), and the neural network regression model yielded the worst fitting effects. Overall, the random forest model is the optimal model for the inversion of the stand mean height of Sonneratia apetala in the study area.
Keywords:
本文引用格式
邓静雯, 田义超, 张强, 陶进, 张亚丽, 黄升光.
DENG Jingwen, TIAN Yichao, ZHANG Qiang, TAO Jin, ZHANG Yali, HUANG Shengguang.
0 引言
红树林群落与其所在的滨海盐生沼泽湿地相互作用形成了红树林生态系统。红树林生态系统是全球最具特色的湿地生态系统,同时具备海洋生态及陆地生态的特性,具有强大的生态防护功能。林分平均高是红树林湿地生态系统模型的一个重要输入参数,是研究红树林碳储量的重要指标之一,也是估算各种红树林参数的基础。因此,采用定量化方法快速、准确地获取红树林林分平均高信息成为了近年来红树林结构参数研究的热点。
人工实地调查在林分平均高调查时费时费力,且调查效率低下。随着遥感技术的日益成熟,遥感技术已成功应用于大尺度森林制图和灾害监测等领域,效率得到了大幅度的提高,但森林高度、生物量等森林结构参数是传统光学遥感无法解决的,而激光雷达(light detection and ranging,LiDAR)技术可以获取森林的结构参数信息[1]。LiDAR是传感器发出激光信号,检测目标物体的位置,接收反射信号从而测量传感器与目标物体之间距离的一种新技术。近几十年来,国内外相关学者在激光点云森林结构参数反演算法方面做了大量的研究, 促进了LiDAR技术在林业方面的发展。其中,Næsset等[2]、Andersen等[3]、焦义涛等[4]、洪奕丰等[5]学者基于机载 LiDAR点云数据,采用线性回归模型对不同区域的森林高度和生物量进行了估算。线性回归模型比较适用于建模目标之间关系相对简单且数据量不大的情况,这类线性回归模型虽然快速简单,但要求建模数据必须满足独立性、线性、正态性以及方差齐性等要求。
相对而言,随机森林、支持向量机以及人工神经网络等算法在构建复杂非线性森林参数估算模型中具有更大优势。如Li等[6]和Monnet等[7]基于机载 LiDAR点云数据,在支持向量机模型的支持下对不同研究区的生物量进行估计,结果显示估测精度较好; 鲁林等[8]和赵勋等[9]基于LiDAR点云数据,采用随机森林算法分别对福建省朱溪河流域的松树以及广西壮族自治区国有高峰林场的人工林林分平均高进行了估算,结果显示林分平均高与实测值具有显著的相关性,其相关系数均超过0.94。但是红树林生长在海岸滩涂地带,人们很难进入其根系繁茂的内部进行测量。虽然国外已有诸多学者对LiDAR反演红树林植被参数的算法开展了深入的研究,但国内学者在这方面的研究较少,仅有少量开展过红树林生物量方面的研究[10-11]。迄今为止,采用机载LiDAR点云对红树林林分平均高方面的研究匮乏。因此,为了支持红树林的恢复、保护和可持续管理,需要采用一种快速高效的模型来评估红树林的林分平均高。而基于机载LiDAR点云数据,采用机器学习算法为红树林林分平均高的估算提供了便捷的技术手段。
无瓣海桑(Sonneratia apetala)天然分布于马来西亚、孟加拉国等国[12],2002年广西钦州市为了加快红树林恢复,从广东湛江市引进了无瓣海桑幼苗进行造林试验。在近年营造的作用下,无瓣海桑迅速占领了适宜的林地,甚至入侵了原生红树林群落[13]。这些入侵的无瓣海桑挤占了原有的本土红树林生长空间,对当地的红树林树种生长造成了一定的影响,但是入侵的无瓣海桑高度如何,目前尚未有定量化的评估数据。鉴于此,基于北部湾茅尾海康熙岭片区的LiDAR点云数据,借助相关数理分析指标对随机森林、支持向量机以及神经网络3种模型进行了优选,在最优模型的支持下估算了研究区的红树林平均高及其空间分布状况,研究方法可为今后该地区无瓣海桑长势的动态监测提供有力的技术支撑。
1 研究区概况
图1
2 数据来源与研究方法
2.1 数据来源
2.1.1 地面实测样地数据获取
2021年1月在康熙岭红树林保护区共布设了66个10 m×10 m的正方形样方,样方中心点分布位置如图1所示,图中采用地理坐标系GCS_WGS_1984,投影坐标系Albers。在布设样方前确定红树林种类、种植模式和当地潮位信息。记录的信息包括样方中的胸径(在高度1.3 m处量测)、树高以及地理坐标(经纬度)等数量特征。
式中: H为林分平均高; gi为第i棵林木的胸高断面积; hi为第i棵林木的树高; n为样方内所有林木的棵数。
图2
图2
研究区野外实测样地数据获取
Fig.2
Field measured sample site data acquisition in the study area
2.1.2 机载LiDAR数据获取
2021年1月19日下午3点采用DJI M600 PRO无人机所搭载的普通数码相机和HS40P激光传感器在广西茅尾海康熙岭片区进行红树林飞行试验,从而获得了LiDAR点云数据。当天拍摄的垂直高度约为70 m,航向及旁向重叠度为80%且风力小于2级。本文利用Intertial Explorer(GPS-IMU)后处理软件结合惯性测量单元(inertial measurement unit,IMU)数据以及全球导航卫星系统(global navigation satellite system,GNSS)技术对原始的红树林回波信息进行解算,可以得到研究区的三维激光点云信息(图3)。
图3
2.2 研究方法
2.2.1 LiDAR点云树高信息提取
机载LiDAR系统由激光测距装置、成像装置、IMU姿态测量装置和全球定位系统(global positioning system,GPS)接收机4部分组成。它利用GPS和IMU分别可以获得激光源的坐标及激光脉冲的方位。激光测距的原理是测量地表采样点的激光回波脉冲对于发射主波的时间差,从而得到传感器到地面采样点的距离[16]。其测距基本原理可表示为:
式中: D为传感器到目标物体的距离; c为光速; T为激光脉冲从激光器到被测物体的来回传输时间。
使用邵为真等[17]提出的不规则三角网滤波算法将不同密度的LiDAR点云数据分离出地面点云与非地面点云(植被点云),对所获取到的地面点进行插值可生成数字高程模型(digital elevation model,DEM),进而将植被点云高程减去DEM数据可得到植被点云的归一化值,最后利用归一化植被点云可提取相关点云变量。由于LiDAR点云的第一回波对植被冠层的检测更为敏感,本研究采用植被冠层的第一回波数据用于估算林分参数[9](表1),包括百分位数高度15个(hp01,hp05,…,hp95,hp99)、百分位数强度15个(ip01,ip05,…,ip95,ip99)、最大高度\强度(hmax\imax)、最小高度\强度(hmin\imin)、平均高度\强度(hmean\imean)、点云高度\强度标准差(hstddev\istddev)、高度\强度变异系数(hcv\icv)、高度\强度众数(hmode\imode)以及百分位数高度\强度四分位数间距(hiq\iiq)。标准差一般反映用于样方内植被点云高度\强度的离散程度,标准差越大,样方内植被点云高程\强度离散程度越大,反之越小。
表1 用于林分平均高估测的点云特征统计量
Tab.1
变量 | 变量意义① |
---|---|
hp01\ip01,…,hp99\ip99 | 所有点云1%,…,99%分位数处对应的高度\强度值 |
hmax\imax | 样方点云高度\强度的最大值 |
hmin\imin | 样方点云高度\强度的最小值 |
hmean\imean | 样方点云高度\强度的平均值mean,计算公式为: |
hstddev\istddev | 样方点云高度\强度的标准差stddev,计算公式为: |
hcv\icv | 样方点云高度\强度的变异系数cv,计算公式为: |
imode\imode | 样方点云高度\强度的众数 |
hiq\iiq | 样方点云百分位数高度\强度的四分位数间距iq,计算公式为: |
①m为每个样方对应归一化植被点云的个数; j为每个样方对应第j个归一化植被点云; xj 为第j植被点云对应的高度值;
2.2.2 林分平均高模型的构建
随机森林算法是分类和回归问题中最受欢迎的机器学习算法之一[18]。随机森林模型由多元回归树组成,在构建每棵回归树的过程中,每棵树节点选择分割变量时,先从所有特征变量中随机选取k个特征变量,然后从中找到最优分割点并生成多个回归树模型。每棵回归树的最终预测结果是节点的平均值,随机森林的最终预测结果是所有回归树预测结果的平均值。随机森林算法使用boot-strap采样和bagging集成树算法,并从弱学习者集合中获得最准确的决策。在学习过程中,大约70%的样本(袋内)用于训练阶段,30%的样本(袋外)用于测试阶段。与其他基于树和增强的机器学习型类似,随机森林模型可以模拟每个变量的重要性程度。随机森林模型中最主要的超参数包括最大深度、最小样本叶数、最小样本分裂数、最大特征数和可调树数。ntree表示随机森林所包含的决策树数目,mtry表示每次迭代的变量抽样数值,为了保证预测结果的准确性和计算结果的精度,本文采用ntree=1 000,mtry的取值范围为1~M,其中M为模型构建所涉及的输入变量的总数。
支持向量机作为著名的机器学习方法,常应用于各种非线性问题的求解[19]。它的学习原理是使用一个称为超平面的边界将数据划分为具有近似值的组。 通过分析输入变量与输出变量之间的定量关系,随后建立模型对新观测到的变量进行预测[20]。对于一个分类或回归问题,支持向量机算法用支持向量定义超平面。与其他机器学习模型相比,支持向量机模型包含较少的核函数超参数(线性、多项式或径向基)和正则化参数C,支持向量机模型能够处理非线性数据; 但是,当组成数据较为嘈杂或重叠时,支持向量机模型效率不高。支持向量机模型的性能受核函数选择的影响。为了减少偏差,本文在建模时尝试了5个可能的C,分别为: 0.01,0.1,1,10和100。
图4
2.2.3 评估标准
式中: yi为真实值;
3 结果与分析
3.1 实测数据特征统计
表2 外业测量树高、胸径和林分平均高的基本统计量
Tab.2
参数 | 最大值 | 最小值 | 平均值 | 标准差 |
---|---|---|---|---|
树高/m | 13.58 | 1.55 | 8.09 | 2.69 |
胸径/cm | 41.00 | 0.70 | 15.38 | 5.55 |
林分平均高/m | 12.02 | 3.47 | 8.19 | 2.28 |
3.2 特征选择
本文对参与红树林树高建模的LiDAR特征变量的重要性进行排序,选择节点不纯度(increase in node purity,IncNodePurity)作为判断LiDAR 特征变量参数重要性的指标。通过比较点云特征统计变量的重要性,特征统计变量的值越大,则特征统计变量的重要性越高(图5)。
图5
图5中重要性值越高,该特征统计变量对林分平均高估测越重要。从图5中可以看出,利用随机森林算法选择的44个特征变量中,高度统计变量参数hmax对无瓣海桑的林分平均高反演贡献率最大,其次是LiDAR 特征变量中的百分位数高度(hp95,hp90,hp99等),LiDAR点云数据中提取到的强度参数对林分平均高反演贡献较小(红色线为分割线,分割线以上的变量对红树林林分平均高的贡献率较大,分割线以下贡献率较小)。75%~99%分位数高度在研究区无瓣海桑的林分平均高估算中发挥了主要作用,这一发现与前人的研究论断契合[8-9],他们的研究认为: 植被冠层的第一回波的75%~95%分位数高度或最大树高hmax能很好地估测平均树高。本文使用16个贡献率相对较大的特征变量参与随机森林模型的构建,随机森林模型取得了令人满意的结果,训练集和测试集的R2分别为0.985 7和0.938 1,RMSE为0.58 m(表3)。
表3 3种ML模型在林分平均高检索中的性能比较
Tab.3
模型 | 训练集 | 测试集 | ||||||
---|---|---|---|---|---|---|---|---|
R2 | RMSE/m | AIC | BIC | R2 | RMSE/m | AIC | BIC | |
随机森林 | 0.985 7 | 0.28 | 36.59 | 21.42 | 0.938 1 | 0.58 | 80.50 | 49.05 |
支持向量机 | 0.985 6 | 0.30 | 37.18 | 22.00 | 0.766 5 | 1.27 | 87.85 | 56.40 |
神经网络 | 0.978 5 | 0.34 | 47.01 | 31.84 | 0.436 4 | 2.90 | 107.61 | 76.16 |
3.3 模型精度对比
将16个贡献率较大的特征变量带入到支持向量机、随机森林和神经网络算法模型中,本研究将70%的样本用于模型的训练,30%的样本用于模型的测试和检验,图6为不同机器学习算法在训练阶段和测试阶段所计算的精度。无瓣海桑林分平均高模型估算的R2越高,RMSE越低,AIC和BIC越低,预测性能越好。由图6可知,支持向量机算法在无瓣海桑林分平均高估算中显示出可接受的结果,测试集中R2为0.766 5,RMSE为1.27 m,AIC为87.85,BIC为56.40; 而神经网络模型的结果相对较差,在测试集中R2值仅为0.436 4。随机森林模型的估算结果在训练集和测试集阶段均表现出较好的结果,R2均达到了0.93以上,总体而言,随机森林模型在研究区域的红树林林分平均高估算中表现最佳。
图6
图6
不同回归模型的训练和测试结果
Fig.6
Training and testing results of different regression models
3.4 林分平均高的空间分布
由于随机森林模型产生了最佳的预测性能,并且优于其余的机器学习算法,因此本研究选择了随机森林算法模型对研究区无瓣海桑林分平均高进行预测。无瓣海桑林分平均高最终结果被计算成栅格数据,以Tiff格式进行存储。由地理信息系统(geographic information system,GIS)的分类工具将林分平均高数据划分为5类,由图7可知,无瓣海桑林分平均高的模拟结果介于3.90~11.58 m之间。 其中树高超过10 m的无瓣海桑主要分布在研究区潮沟附近及研究区中部,这可能与潮沟水文过程有关,潮沟所带有的营养物质可能给红树林的生长提供了充足的养分。
图7
4 讨论
本文实测得到北部湾茅尾海(康熙岭片区)的无瓣海桑树高平均值为8.09 m,比张晓君等[24]在广东省珠海市鹤洲北湿地地区统计到的无瓣海桑树高平均值高了0.59 m,也比黄晓敏等[25]在福建省厦门市集美海湾调查得到的无瓣海桑平均树高值高了0.39 m。但是,吴瑞等[26]在海南省东寨港的三江地段得到的无瓣海桑平均树高为14.2 m,高于本研究区的无瓣海桑树高。无瓣海桑的树高不仅与它的生长年龄相关,同时与它生长环境的海水温度、海水盐度、土壤及沉积物、潮汐浸淹频率和海浪能量等因素更是息息相关[27]。低温、生长环境的盐分含量过高或过低均会限制无瓣海桑的生长,并且,不同的红树林植物对潮汐浸淹频率都有相应的适应性,无瓣海桑主要分布在大潮中潮位; 海浪能量太大时,会阻碍无瓣海桑的根系生长[28]。除此之外,无瓣海桑平均高还与模型的精度有着直接的关系,模型的精度不仅受到模型本身因素的影响,而且受到其他多种外部因素的影响[29]。本研究在进行红树林样方调查时并不是直接测量无瓣海桑的林分平均高,而是根据森林的断面积加权法计算林分平均高,断面积加权法的准确度可能会影响模型的估算效果。
随着机器学习算法的发展,林分平均高的估算有了更多的算法。在林分平均高估算算法中,机器学习算法通常比传统的参数方法获得更好的预测性能。Brice等[30]发现在林分平均高估算中,随机森林算法优于线性回归算法。Pourrahmati等[31]研究发现: 在洛里高度(代表了非均匀年龄林分的平均高度)估测中随机森林优于人工神经网络。每种机器学习算法都有自己的适用性和优势,但机器学习方法的选择、参数的确定均对预测模型的精度有一定的影响[32]。因此,本研究采用R语言的“Random Forest”软件包提供的importance进行重要性排序。根据评价指标来获取各模型的最佳参数,利用最佳的参数进行模型模拟。由3种机器学习算法的模拟结果可知,随机森林模型表现出很高的模型拟合能力,其R2在测试集和训练集上均达到了0.938 1以上,RMSE均为0.58 m以下,支持向量机模型次之,该模型在测试阶段的R2为0.766 5,RMSE为1.27 m,神经网络回归模型的拟合效果最差。这些研究结果表明,在对不同的树种选择不同的特征参数时,机器学习算法均表现出一定的差异性。随机森林模型具有变量选择功能,对无信息的预测变量之间的共线性不敏感。然而,支持向量机和神经网络模型往往受到无信息和高度相关预测变量的影响,降低了模型的性能[18]。总之,在本研究区,随机森林算法明显优于其他2种算法,该算法可在北部湾其他地区的红树林林分平均高估算中发挥重要的作用,但是模型最优参数的选择具有一定的不确定性,应该根据实际需要进行参数和变量的优选[11]。
由于受样方环境的影响,样方的选择受到了限制,无法遍及更大的区域。即使模型得到了较为满意的反演结果,但是推广到更大的区域或许精度会受到一定的影响,因此对样方的采集可以选择在退潮时量测更多的红树林数据。未来的研究可能利用机载LiDAR,在更大尺度上对不同沿海地区的无瓣海桑树种进行预测,从而提升随机森林算法在预测红树林林分平均高上的实用性,并寻求一种能获取潮位相对较高区域的实测数据的方法,使得研究范围更大。由于机载LiDAR数据采集成本高,试验仅在典型的小区域进行,未来可以选择尺度上推算法,将LiDAR点云测量的样方数据推演到哨兵数据尺度或者Landsat卫星尺度上。本研究中采用随机森林算法对无瓣海桑的林分平均高进行估算是否适用于其他地区的无瓣海桑或其他红树林树种,尚需进一步检验。
5 结论
本研究以北部湾茅尾海红树林湿地为研究对象,基于机载LiDAR数据采用3种机器学习算法对研究区无瓣海桑的林分平均高进行建模,并反演了研究区的红树林树高空间分布。其主要研究结论如下:
1)研究区林分树高范围为3.47~12.02 m,平均值为8.19 m。
2)样方点云高度最大值hmax对无瓣海桑的林分平均高的贡献率最大,其次是75%~99%分位数高度。
3)随机森林回归模型的预测性能最好(R2=0.938 1,RMSE=0.58,AIC=80.50,BIC=49.05),其次是支持向量机回归模型(R2=0.766 5,RMSE=1.27,AIC=87.85,BIC=56.40),BP神经网络的模型预测性能最差(R2=0.436 4,RMSE=2.90,AIC=107.61,BIC=76.16)。
4)随机森林反演结果可知,树高较高、胸径较大的单木红树林主要分布在研究区潮沟附近以及研究区中部。
参考文献
激光雷达技术及其在林业上的应用
[J].
LiDAR remote sensing technology and its application in forestry
[J].
Estimating tree height and tree crown properties using airborne scanning laser in a boreal nature reserve
[J].DOI:10.1016/S0034-4257(01)00243-7 URL [本文引用: 1]
Estimating forest canopy fuel parameters using LiDAR data
[J].DOI:10.1016/j.rse.2004.10.013 URL [本文引用: 1]
基于机载LiDAR点云估测林分的平均树高
[J].
Study on mean canopy height estimation from airborne LiDAR point cloud date
[J].
基于机载激光雷达的落叶松组分生物量反演
[J].
Inversion of biomass components for Larix olgensis plantation using airborne LiDAR
[J].
Forest biomass and carbon stock quantification using airborne LiDAR data:A case study over Huntington Wildlife Forest in the Adirondack Park
[J].DOI:10.1109/JSTARS.2014.2304642 URL [本文引用: 1]
Support vector regression for the estimation of forest stand parameters using airborne laser scanning
[J].DOI:10.1109/LGRS.2010.2094179 URL [本文引用: 1]
随机森林算法在机载LiDAR数据林分平均树高估算中的应用研究
[J].
DOI:10.3724/SP.J.1047.2016.01133
[本文引用: 2]
采用机载LiDAR数据估算森林结构参数是当前林业遥感中的研究热点。本文以福建省长汀县朱溪河流域为示范区,探讨了随机森林算法(RF)在机载LiDAR数据林分平均树高估测中的适用性。首先,通过渐进三角网(TIN)算法进行点云滤波并获取相应林分样地的植被点云子集和高程归一化的植被点云;然后,从归一化后的植被点云提取出高度分位数变量以及点云统计特征值等24个变量参数;最后,根据提取的变量参数和野外实测林分均高数据建立研究区林分平均高随机森林回归估测模型。研究结果表明,模型估测的样地平均树高与实测值具有明显线性相关关系,线性回归系数为0.938,相关系数达到0.968。对样地的估测精度都在86%以上,总体平均精度达到了93.17%。研究认为,基于植被点云变量参数的随机森林模型估测林分平均树高具有较高的可靠性。
Plot-level forest height inversion using airborne LiDAR data based on the random forest
[J].
基于机载LiDAR数据估测林分平均高
[J].
Estimation of forest stand mean height based on airborne LiDAR point cloud data
[J].
Aboveground mangrove biomass estimation in Beibu Gulf using machine learning and UAV remote sensing
[J].DOI:10.1016/j.scitotenv.2021.146816 URL [本文引用: 2]
外来红树植物无瓣海桑生物学特性与生态环境适应性分析
[J].
Biological characteristics and ecological adaptability for non-indigenous mangrove species Sonneratia apetala
[J].
广西钦州沿海无瓣海桑入侵性初探
[J].
A preliminary exploration on the eological invasion of Sonneratia apetala in Qinzhou area of Guangxi
[J].
北部湾典型海岛生态系统服务价值空间异质性对比研究
[J].
A comparative study of spatial heterogeneity of ecosystem service value in typical islands in Beibu Gulf
[J].
林分平均树高的求算与分析
[J].
Calculation and analysis of mean height of tree stand
[J].
Airborne laser scanning:Basic relations and formulas
[J].DOI:10.1016/S0924-2716(99)00015-5 URL [本文引用: 1]
基于不规则三角网的渐进加密滤波算法研究
[J].
The research of improved progressive triangulated irregular network densification filtering algorithm
[J].
Random forest
[J].DOI:10.1023/A:1010933404324 URL [本文引用: 2]
Support vector machine:Principles,parameters,and applications
[J].
A new look at the statistical model identification
[J].DOI:10.1109/TAC.1974.1100705 URL [本文引用: 1]
Estimating the dimension of a model
[J].
Model selection and psychological theory:A discussion of the differences between the Akaike information criterion (AIC) and the Bayesian information criterion (BIC)
[J].
DOI:10.1037/a0027127
PMID:22309957
[本文引用: 1]
This article reviews the Akaike information criterion (AIC) and the Bayesian information criterion (BIC) in model selection and the appraisal of psychological theory. The focus is on latent variable models, given their growing use in theory testing and construction. Theoretical statistical results in regression are discussed, and more important issues are illustrated with novel simulations involving latent variable models including factor analysis, latent profile analysis, and factor mixture models. Asymptotically, the BIC is consistent, in that it will select the true model if, among other assumptions, the true model is among the candidate models considered. The AIC is not consistent under these circumstances. When the true model is not in the candidate model set the AIC is efficient, in that it will asymptotically choose whichever model minimizes the mean squared error of prediction/estimation. The BIC is not efficient under these circumstances. Unlike the BIC, the AIC also has a minimax property, in that it can minimize the maximum possible risk in finite sample sizes. In sum, the AIC and BIC have quite different properties that require different assumptions, and applied researchers and methodologists alike will benefit from improved understanding of the asymptotic and finite-sample behavior of these criteria. The ultimate decision to use the AIC or BIC depends on many factors, including the loss function employed, the study's methodological design, the substantive research question, and the notion of a true model and its applicability to the study at hand.(c) 2012 APA, all rights reserved
珠海人工红树林与天然红树林群落特征比较研究
[J].
Comparison on the community characteristics between artificial and natural mangroves in Zhuhai City
[J].
厦门海湾典型无瓣海桑人工种群特征和幼苗更新扩散现状研究
[J].
Studies on the characteristics of artificial population of Sonneratia apetala and the current recruitment and dispersal of the seedlings in Xiamen Bay
[J].
海南省东寨港红树林资源现状调查分析
[J].
Survey of mangrove resources in Dongzhai Harbour of Hainan Province
[J].
红树林造林修复技术探讨
[J].
Discussion on techniques of mangrove afforestation and rehabilitation
[J].
Aboveground forest biomass estimation with Landsat and LiDAR data and uncertainty analysis of the estimates
[J].
Forest inventory stand height estimates from very high spatial resolution satellite imagery calibrated with LiDAR plots
[J].DOI:10.1080/01431161.2013.779041 URL [本文引用: 1]
Mapping Lorey’s height over Hyrcanian forests of Iran using synergy of ICESat/GLAS and optical images
[J].DOI:10.1080/22797254.2017.1405717 URL [本文引用: 1]
Mapping of hyperspectral AVIRIS data using machine-learning algorithms
[J].
/
〈 |
|
〉 |
