自然资源遥感, 2023, 35(1): 49-56 doi: 10.6046/zrzyyg.2022045

技术方法

一种利用贝叶斯优化的蓝藻遥感分类方法

田晨,1, 张金龙1, 金义蓉1, 董世元,2, 王彬2, 张乃祥2

1.苏州市水利水务信息调度指挥中心,苏州 215011

2.苏州中科蓝迪软件技术有限公司,苏州 215163

A remote sensing classification method for cyanobacteria using Bayesian optimization algorithm

TIAN Chen,1, ZHANG Jinlong1, JIN Yirong1, DONG Shiyuan,2, WANG Bin2, ZHANG Naixiang2

1. Suzhou Water Conservancy and Water Information Dispatching Command Center, Suzhou 215011, China

2. Suzhou Land Think Software Technology Company Limited of Chinese Academy of Science, Suzhou 215163, China

通讯作者: 董世元(1994-),男,硕士,主要从事遥感信息提取、机器学习、深度学习等研究工作。Email:dongsyrs@163.com

责任编辑: 张仙

收稿日期: 2022-02-11   修回日期: 2022-08-22  

基金资助: 苏州市水利水务科技项目“基于光学与SAR联合观测的湖泊凤眼莲分布自动化提取研究”(2021009)

Received: 2022-02-11   Revised: 2022-08-22  

作者简介 About authors

田晨(1982-),男,硕士,主要从事环境水利学方向研究工作。Email: tc1115@126.com

摘要

利用Sentinel-2遥感卫星影像,结合遥感优势以光谱、指数、纹理等14种多种特征信息为输入,依托贝叶斯优化算法,设计了一种能自动获取最优超参数组合的BO-XGBoost方法,并将其成功应用于2021年阳澄湖蓝藻信息提取。结果表明: ①通过贝叶斯优化算法获取最优超参数组合,进行训练得到BO-XGBoost蓝藻分类模型,其训练结果在测试集和训练集上表现效果良好,准确率高达96.07%; ②将BO-XGBoost应用于参与样本集构建的影像,其蓝藻识别结果与人工解译成果对比,2种方法得到的蓝藻空间分布情况基本一致,交并比最低为41.31%; ③为评价该分类模型在其他时相的适用性,选择其他时相影像数据进行蓝藻提取,BO-XGBoost与人工解译2种方法蓝藻空间分布情况基本一致,交并比最低为43.85%。

关键词: 贝叶斯优化; BO-XGBoost; 多特征; 蓝藻; Sentinel-2

Abstract

With 14 types of multi-feature information, such as spectrum, index, and texture, of remote sensing images from satellite Sentinel-2 as input and using the Bayesian optimization algorithm, this study designed the BO-XGBoost method used to automatically obtain the optimal hyperparameter combination. This method was successfully applied to the information extraction of cyanobacteria in Yangcheng Lake in 2021. The results show that: ① The optimal hyperparameter combination was obtained using the Bayesian optimization algorithm, and then the BO-XGBoost cyanobacteria classification model was established through obtaining. The training results performed well on the test and training sets, with an accuracy rate of up to 96.07%; ② The BO-XGBoost method was applied to the images used in the sample set. The comparison between the cyanobacteria identification results and the manual interpretation results shows that the two methods yielded roughly the same spatial distribution of cyanobacteria, with a lowest intersection over union (IoU) of 41.31%; ③ To evaluate the applicability of the BO-XGBoost method in other periods, images of other periods were selected for the information extraction of cyanobacteria. As a result, both BO-XGBoost and manual interpretation also yielded roughly the same spatial distribution of cyanobacteria, with a lowest IoU of 43.85%.

Keywords: Bayesian optimization; BO-XGBoost; multi-feature; cyanobacteria; Sentinel-2

PDF (7416KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

田晨, 张金龙, 金义蓉, 董世元, 王彬, 张乃祥. 一种利用贝叶斯优化的蓝藻遥感分类方法[J]. 自然资源遥感, 2023, 35(1): 49-56 doi:10.6046/zrzyyg.2022045

TIAN Chen, ZHANG Jinlong, JIN Yirong, DONG Shiyuan, WANG Bin, ZHANG Naixiang. A remote sensing classification method for cyanobacteria using Bayesian optimization algorithm[J]. Remote Sensing for Land & Resources, 2023, 35(1): 49-56 doi:10.6046/zrzyyg.2022045

0 引言

蓝藻大面积暴发,不仅破坏湖泊景观,导致生物量减少,同时也会造成水体自净能力失衡,严重影响湖泊水生态环境[1]。自“十三五”规划以来,内陆湖泊生态环境得到改善,但是受常年环境问题影响,蓝藻暴发等一系列问题仍然严重威胁水生生态系统。随着遥感技术的发展,越来越多的卫星遥感技术应用于环境治理中[2-3],利用卫星遥感技术的空间优势可实时快捷地获取蓝藻暴发区域地时空分布特征,掌握蓝藻生长情况,为环境治理、管控提供数据和技术支撑。

目前,国内外众多学者采用多种方法进行遥感影像蓝藻信息提取。其中光谱指数法应用较为广泛,该方法通过蓝藻光谱特性构建能够表征蓝藻特征的光谱指数,主要包括: 归一化植被指数(normalized difference vegetation index, NDVI)[4]、增强型植被指数(enhanced vegetation index, EVI)[2-3,5]、漂浮藻类指数(floating algae index, FAI)[5]、替代型漂浮藻类指数(alternative floating algae index,AFAI)[6]等; 同时也有学者进一步结合多个光谱指数构建利用机器学习分类方法,如: 决策树、支持向量机、神经网络、随机森林等蓝藻提取方法[7-12]。此外还有学者提出了蓝藻提取的非监督分类方法[13]。综合对比以上几种分类方法,光谱指数法通过专家经验设定固定阈值对蓝藻信息信息提取,缺乏可拓展性,难以针对长时间序列的遥感影像数据集确定唯一有效阈值进行蓝藻识别; 监督分类方法识别精度相比于其他方法精度较高,但在训练过程中需要设定模型超参数,然而对于模型超参数的选择上往往靠过去的经验和大量的人工调试,很难得到最优的网络结构和参数,另一方面训练蓝藻分类模型需要标记大量样本,人工成本较高; 非监督分类方法的分类精度则无法保证,需要大量的长时间序列数据进行分析。

XGBoost(eXtreme Gradient Boost)于2016年SIGKDD大会提出,是一种结合梯度提升和决策树的集成学习方法[14],能够自动利用CPU的多线程进行并行,在算法运行效率和精度上有明显提升,近年来广泛应用于遥感监测领域,如总磷、总氮、叶绿素a等水质指标反演[15],以及遥感地物分类[16],目前XGBoost分类算法在遥感蓝藻监测研究中鲜有报道。机器学习分类模型训练精度受超参数影响较大,较差的超参数组合策略易导致模型过拟合或者欠拟合,贝叶斯优化算法(Bayesian optimization)利用先验知识逼近未知函数的后验分布从而调节最优超参数组合,相较于传统的专家经验设定、网格检索等方法,贝叶斯优化算法更能反映实际问题的本质,并在众多领域中获得应用,如: 经济预测、舆情分析等领域[17]。在以往遥感监测分类算法研究中,机器学习超参数选取一般基于专家经验进行选择,利用贝叶斯优化寻找最优解的方法涉及较少。

光学遥感影像包含光谱特征、指数特征、纹理特征,结合多遥感特征进行蓝藻分类提取可以避免光谱混淆,提升模型精度[18]。本文以遥感影像包含的光谱、指数、灰度共生矩阵等多特征信息作为输入,利用贝叶斯优化算法寻找XGBoost模型全局最优解对蓝藻识别模型进行训练,生成BO-XGBoost蓝藻识别模型,将该模型应用于2021年阳澄湖蓝藻信息提取,与人工标注结果进行对比验证,并针对BO-XGBoost模型的适用性和优缺点进行评价。本研究的成果可为遥感领域机器学习算法优化问题提供参考,以及分析阳澄湖蓝藻发生规律和进一步湖泊生态环境治理提供技术指导。

1 研究区概况与数据源

1.1 研究区概况

阳澄湖位于江苏省苏州市北部,是典型内陆湖泊,占地约120 km2。阳澄湖由于富营养化引起的蓝藻暴发是水生态安全、生物多样化的重要影响因素,严重威胁苏州市、昆山市饮用水安全[19]图1展示了阳澄湖水域范围,其中,阳澄湖包含大面积的大闸蟹围网养殖区域,易与蓝藻发生混淆,经观察发现阳澄湖围网养殖区域常年不变,因此该部分区域不在研究范围内。

图1

图1   阳澄湖水域范围

(底图为Sentinel-2 B8(R),B4(G),B3(B)波段合成影像)

Fig.1   Yangcheng Lake water area


1.2 数据获取及处理

阳澄湖湖泊面积较小,及时掌握阳澄湖蓝藻暴发的空间分布形态对卫星遥感影像空间、时间分辨率要求较高。本文使用欧洲航空安全局(European Aviation Safety Agency,ESA)提供的免费数据源Sentinel-2,其空间分辨率为10 m,S2A和S2B星联合观测时间分辨率可达5 d[20],能够满足阳澄湖蓝藻暴发监测的需求。Sentinel-2数据可从ESA官方网站(https://scihub.copernicus.eu/dhus/#/home)进行下载,下载得到L1C数据,该数据已进行过几何纠正和辐射校正,利用官方推荐的Sen2cor软件对其进行大气校正,可得到10 m分辨率的反射率数据。本文使用2021年6—10月份无云或少云的8期遥感数据进行蓝藻监测,表1展示了本文中使用的Sentinel-2卫星数据日期。

表1   阳澄湖影像过境时间

Tab.1  Yangcheng Lake image transboundary time

序号日期云层覆盖率/%载荷类型
16月22日0S2B星
27月7日0.85S2A星
37月12日0S2B星
48月26日0S2A星
58月31日0S2B星
69月30日2.48S2B星
710月5日0S2A星
810月30日1.26S2B星

新窗口打开| 下载CSV


2 研究方法

2.1 特征提取

光谱特征是表征地物类型的重要手段之一,本文中选取的光谱特征为Sentinel-2影像数据的4个波段。同时选取能够表征蓝藻、水体的光谱指数NDVI、归一化差异水体指数(normalized difference water index, NDWI),计算公式分别为:

NDVI=NIR-RedNIR+Red
NDWI=Green-NIRGreen+NIR

式中NIR,RedGreen分别为近红外、红光和绿光波段,对应Sentinel-2影像B8,B4和B3波段。

通过光谱特征和光谱指数只能表征单一像元的地物类型,忽略了遥感影像携带的空间纹理特征,本文使用常用的纹理特征提取方法——灰度共生矩阵,通过计算相对位置固定像素对的灰度频率来提取纹理信息[21]。本文利用NDVI作为灰度矩阵,灰度量化级选择值为32,统计像元窗口大小为9像元×9像元,提取了8个纹理特征,包括: 对比度、相异性、同质性、角二阶矩、方差、均值、最大概率和相关性。

将光谱特征、指数特征、纹理特征共14个特征进行融合,多特征图如图2所示,并用于Sentinel-2的蓝藻分类提取特征集。

图2

图2   多特征分布图

Fig.2   Multi-feature distribution map


2.2 样本选取

2021年6—10月期间,选择天气晴朗且有Sentinel-2影像数据过境日期对阳澄湖进行实地踏勘。图3为2021年8月26日阳澄湖实地踏勘成果和对应日期的Sentinel-2影像数据,图3(a)可以看出点位2,3,5,20有藻类聚集,点位11,12,17,18有水生植被聚集。观察图3(a)图3(b)蓝藻与其他水生植被在影像呈现的状态,发现蓝藻多以大面积,絮状分布为主,其他水生植被一般有明显的分类边界,以小范围、零散、近陆地分布为主。通过计算NDVI,并结合实地调研结果,对蓝藻在遥感影像上进行标注,标注结果如图3(c)。选取表1中4景遥感影像数据进行样本提取,分别为7月7日、8月26日、9月30日、10月30日,根据人工标注结果,针对蓝藻、其他植被、水体、云4类目标物各随机选取250个点位共计1 000个样本数据,其中蓝藻为目标,其他植被、水体、云为背景。剩余4期影像数据不参与模型训练过程,以便验证分类模型的泛化能力。

图3

图3   2021年8月26日数据展示

Fig.3   Data display on August 26, 2021


2.3 基于贝叶斯优化的XGBoost分类方法

贝叶斯优化是根据目标函数f(x)的历史评价结果建立计算先验分布,结合前次迭代得到的观察点E,来获取后验分布,进而基于后验信息选择下一个样本点,使目标函数f(x)最小[22]。后验分布的具体计算方法公式为:

P(M|E)P(E|M)P(M)

式中: M为模型目标函数值; E为观察点表示已观测集合; P(M)P(M|E)分别为M的先验和后验概率分布; P(E|M)为似然比概率。EM之间满足如下递归关系:

E1={(θ1,M1)},Dt={Dt-1,(θt,Mt)}

式中: Mt为与θt对应的目标函数值; Dt为获取评估点θt的函数值Mt,并将其加入到评估集合中。

另外,贝叶斯优化算法有2个核心部分,即概率代理模型和采集函数[23]。本文选用高斯过程[24-25]和PI函数[25]作为概率代理模型和采集函数。

XGBoost是基于决策树的监督模型,属于集成学习Boosting算法的一种,思想是使用多个CART分类树作为弱学习器,增加的决策树学习上一轮预测结果的残差,通过不断地增加新树使得损失值最低,最终基于加法模型将多个弱学习器集成为一个强学习器,进而获得一个高精度的机器学习模型。XGBoost算法需要在训练前设定子模型数量、学习率、树最大深度、惩罚系数等超参数,使用人工检索或网格搜索方法确定最优超参数组合达到最小误差和避免过拟合,会消耗大量计算时间。本文使用贝叶斯优化自动调整XGBoost超参数,在有限的检索次数内达到最优值,从而保证得到最优超参数组合进行蓝藻识别和提取。

利用贝叶斯优化算法,对XGBoost算法进行30次评估,单次评估过程中设置五折交叉验证,并利用准确率指标对目标参数进行评估。在贝叶斯优化过程中,每次观测到的准确率如图4所示。在贝叶斯优化评估结束后,得到最优可行点,最优参数取值表2所示,在此参数下XGBoost模型对蓝藻的识别性能在验证集上准确度达到98.71%。

图4

图4   贝叶斯优化迭代情况

Fig.4   Bayesian optimization iteration case


表2   XGBoost最优超参数组合

Tab.2  XGBoost optimal hyperparameter combination

变量含义取值范围步长最优值
max_depth子模型最大深度[5, 15]14
learning_rate学习率0.001, 0.01, 0.1, 1, 100.1
n_estimators子模型数量[10, 300]1035
subsample随机采样的比例(0, 1)0.10.5
colsample_bytree特征占比(0, 1]0.10.4
min_child_weight最小叶节点样本权重和[1, 10]14

新窗口打开| 下载CSV


2.4 精度评价

通过混淆矩阵对BO-XGBoost蓝藻分类模型精度进行评估,确定4个评价指标,即精确率(Precision)、召回率(Recall)、F1指标和Kappa系数。另外,利用交并比(intersection over union,IoU)评价人工标注成果和识别结果之间的差异大小,以验证分类模型实际应用效果。精确率描述正确分类的数量与模型识别出的数量占比; 召回率描述正确分类的数量与真实数量的占比; F1指标为精确率和召回率的调和平均数; Kappa系数描述模型预测结果和实际分类结果的一致性; IoU描述正确分类区域与模型识别结果和真实区域交集的比值。

3 结果与分析

3.1 模型分类结果

采用依托贝叶斯优化生成的最优参数组合,利用XGBoost算法对提取的1 000条样本集进行训练,随机抽取70%样本数据作为样本集,30%样本数据作为测试集。经训练后生成BO-XGBoost模型,利用精确率、召回率、F1指标、Kappa系数对样本集进行评价,表3展示了BO-XGBoost分类算法分别在训练集和测试集上的表现,其中水体、云、其他植被为背景物,蓝藻为目标物。从表3可以看出,在训练集、测试集上,云类识别精度最高,水体次之,蓝藻精度较低但F1指标仍在98%以上。BO-XGBoost在测试集上各项指标精度均高于96.07%,且测试集、训练集表现相似相差较小,该模型在样本数据训练过程中不存在过拟合和欠拟合的问题。

表3   分类模型精度评价

Tab.3  Classification Model Accuracy Evaluation

评价指标训练集测试集
蓝藻水体其他植被蓝藻水体其他植被
精确率/%98.6198.8699.8898.6396.0799.3299.4698.11
召回率/%97.8299.5799.7798.9797.8698.6698.9397.33
F1/%98.2299.2199.8298.8096.9698.9999.1997.72
Kappa0.986 70.975 6

新窗口打开| 下载CSV


为确定BO-XGBoost分类模型的实际应用情况,利用7月7日、8月26日、9月30日、10月30日参与样本集提取的4期影像数据进行蓝藻提取。图5(a)—(d)展示了Sentinel-2的标准假彩色影像,图5(e)—(h)展示了BO-XGBoost的蓝藻分类结果,其中黄色区域为蓝藻区域,图5(i)—(l)展示了人工判别标注的蓝藻分类结果。对比BO-XGBoost和人工解译蓝藻提取成果可发现,人工目视解译成果的蓝藻空间分布与BO-XGBoost识别结果相似,图中可知4期遥感影像数据蓝藻主要暴发区域为阳澄西湖,2种方法蓝藻区域表征基本一致。在蓝藻聚集程度较低的区域,遥感影像上蓝藻与水体边界不清晰,表征不明显,仅利用真彩色、假彩色、NDVI等指数进行人工解译的方法,蓝藻提取结果受主观因素影响较大,尤其蓝藻边界区域的划分。BO-XGBoost机器学习分类算法具备一定客观性,同时该算法从光谱、纹理、光谱指数多个角度对蓝藻区域进行判别,可有效对蓝藻边界进行区分。

图5

图5   2021年参与样本集构建的蓝藻识别成果对比

Fig.5   Comparison of cyanobacterial identification results participating in the construction of the sample set in 2021


为更好地表征BO-XGBoost算法与人工解译提取的蓝藻结果的区别,选取8月26日发生大规模蓝藻聚集区域进行细节对比,如图6所示。从图中可以看出: ①BO-XGBoost相比于人工解译方法,蓝藻监测区域较大,能够提取出低聚集蓝藻区域; ②BO-XGBoost算法受岸线混合像元影响,将岸边植被误提取为蓝藻; ③人工解译结果标准不统一,如图6(c)红框范围处蓝藻零星出现,但人为判断过程中将此处标记为蓝藻。

图6

图6   8月26日蓝藻识别成果细节对比

Fig.6   Comparison of details of cyanobacteria identification results on August 26


为定量化描述BO-XGBoost分类模型与人工解译成果之间的蓝藻分类差异程度。表4展示了BO-XGBoost分类算法和人工解译提取的蓝藻面积,以及2种方法得到蓝藻区域的IoU计算结果。IoU指标存在一定差异,2种方法得到的蓝藻区域IoU高于41.31%,其中7月7日最高为55.46%,造成这种差异的主要原因在于: 人工解译进行蓝藻提取过程主要利用NDVI值和人工目视解译方法进行判别,针对不同区域不同情况下NDVI划分阈值,最后再依据人工经验对NDVI划分阈值的结果边界进行修订,最终得到蓝藻提取结果,过程中受人为主观影响因素较大。对比图5的蓝藻成果细节,IoU指标差异主要体现在以下2点: ①算法提取结果受岸边混合像元影响,岸边易被误识别为蓝藻,而人工解译结果,在人工审核过程中已经去除岸边的细碎斑点; ②由于人工解译过程,其结果受人为主观因素影响,其边界判定条件不统一,无法客观表征蓝藻提取结果。

表4   蓝藻提取面积及IoU评价指标

Tab.4  Cyanobacteria extraction area and IoU evaluation index

日期IoU/%BO-XGBoost
/km2
人工解译
/km2
7月7日55.464.289 22.743 6
8月26日41.5316.521 611.235 8
9月30日41.312.305 12.897 4
10月30日43.280.896 80.812 4

新窗口打开| 下载CSV


综上所述,基于贝叶斯优化进行XGBoost模型超参数选取的方法,提取的超参数组合适用于遥感蓝藻分类。同时,基于光谱、指数、灰度共生矩阵为多特征输入,其训练结果,应用Sentinel-2影像数据时,与人工判读结果区域表征基本一致,蓝藻提取结果和其他地物边界区分明显。

3.2 适用性分析

受大气状况、气象条件、传感器硬件等影响,大部分研究人员利用阈值对蓝藻进行提取时所利用的阈值相差甚远[26-28]。为验证BO-XGBoost分类算法在其他时序遥感影像上的适用性,本文将6月22日、7月12日、8月31日、10月5日未参与样本提取的4期遥感影像数据,分别利用BO-XGBoost和人工解译2种分类方法进行蓝藻提取。

表5展示了BO-XGBoost算法和人工解译提取的蓝藻面积和交并比IoU指标。IoU指标在7月12日最低为43.85%,10月5日最高为50.22%。6月22日、7月12日BO-XGBoost蓝藻提取面积高于人工解译结果,其余2期面积接近。图7展示了BO-XGBoost算法和人工解译2种方法提取的蓝藻空间分布情况,图中黄色区域为蓝藻分布情况,对比图7(b)和(c)可以发现,2种方法提取的蓝藻分布情况基本一致,蓝藻暴发区域主要集中于阳澄西湖沿岸附近。

表5   蓝藻提取面积及IoU评价指标

Tab.5  Cyanobacteria extraction area and IoU evaluation index

日期IoU/%BO-XGBoost
/km2
人工解译
/km2
6月22日44.754.073 83.167 1
7月12日43.853.465 31.671 9
8月31日44.011.486 61.642 2
10月5日50.220.585 40.678 4

新窗口打开| 下载CSV


图7

图7   2021年未参与样本集构建的蓝藻识别成果对比

Fig.7   Comparison of cyanobacterial identification results that did not participate in the construction of the sample set in 2021


4 结论

本文以江苏省苏州市阳澄湖为研究区域,利用Sentinel-2遥感图像数据以及实地踏勘情况对样本进行标注,以遥感数据特有的光谱、指数、纹理等多特征为分类模型输入,结合贝叶斯优化和XGBoost算法构建BO-XGBoost蓝藻提取模型。经实验验证该模型算法对2021年不同月份蓝藻监测具有很好的适用性,蓝藻分类准确度高达96%,实际应用中所提取的蓝藻与人工提取的蓝藻空间分布结果一致性较高,并经长时序影像数据验证该模型泛化能力强,能够适应不同月份的蓝藻提取和分类应用。

本文提出的BO-XGBoost训练模式,可自动确定XGBoost模型最优超参数组合,且该参数组合能够在提升模型精度的同时,避免模型过拟合和欠拟合情况发生。结合遥感影像优势,以光谱、指数、灰度共生矩阵多特征为输入进行模型训练,其蓝藻提别结果与其他地物边界区分明显,蓝藻提取区域与人工解译区域基本一致。表明本文所提方法能够有效对湖泊蓝藻进行自动有效提取。

本文虽然利用贝叶斯优化、XGBoost、多特征进行湖泊蓝藻信息提取,同时验证了在相同区域其他时相遥感影像数据蓝藻信息提取的有效性,但仍存在不足之处在于,该蓝藻识别模型是否可直接应用于其他湖泊进行蓝藻信息提取有待验证; 输入多特征进行模型训练时,光谱、指数、灰度共生矩阵包含的14类特征哪一类特征更能表征蓝藻分布情况,并未进行验证。后续工作将针对其他湖泊区域进行实验以验证模型的泛化能力,另外基于基尼指数、卡方检验等方法对特征重要性进行评价。

参考文献

胡智华, 林妙丽, 李港, .

城市闸控河流浮游植物群落结构特征及影响因素

[J]. 环境科学学报, 2021, 41(9):3631-3640.

[本文引用: 1]

Hu Z H, Lin M L, Li G, et al.

Phytoplankton community characteristics and influencing factors of the urban gate-controlled rivers

[J]. Acta Scientiae Circumstantiae, 2021, 41(9):3631-3640.

[本文引用: 1]

岩腊, 龙笛, 白亮亮, .

基于多源信息的水资源立体监测研究综述

[J]. 遥感学报, 2020, 24(7):787-803.

[本文引用: 2]

Yan L, Long D, Bai L L, et al.

A review on water resources stereoscopic monitoring systems based on multisource data

[J]. National Remote Sensing Bulletin, 2020, 24(7):787-803.

[本文引用: 2]

谢勇, 李凯云, 李家国, .

Sentinel-2A影像珠海市污染水体识别

[J]. 遥感信息, 2021, 36(3):1-9.

[本文引用: 2]

Xie Y, Li K Y, Li J G, et al.

Water pollution identification in Zhuhai City based on Sentinel-2A imagery

[J]. Remote Sensing Information, 2021, 36(3):1-9.

[本文引用: 2]

邱亚会, 卢剑波.

浒苔遥感监测研究进展

[J]. 生态学报, 2015, 35(15):4977-4985.

[本文引用: 1]

Qiu Y H, Lu J B.

Advances in the monitoring of Enteromorpha prolifera using remote sensing

[J]. Acta Ecologica Sinica, 2015, 35(15):4977-4985.

[本文引用: 1]

Xing Q G, Hu C M.

Mapping macroalgal blooms in the Yellow Sea and East China Sea using HJ-1 and Landsat data:Application of a virtual baseline reflectance height technique

[J]. Remote Sensing of Environment, 2016, 178:113-126.

DOI:10.1016/j.rse.2016.02.065      URL     [本文引用: 2]

陈春波, 周宝同, 田永中, .

环境一号卫星多光谱数据在巢湖动态监测中的应用

[J]. 中国环境监测, 2014, 30(1):200-204.

[本文引用: 1]

Chen C B, Zhou B T, Tian Y Z, et al.

Application of environmental satellite HJ1A/1B-CCD data for Cyanobacteria dynamic monitoring in Chaohu Lake

[J]. Environmental Monitoring of China, 2014, 30(1):200-204.

[本文引用: 1]

Hu C.

A novel ocean color index to detect floating algae in the global oceans

[J]. Remote Sensing of Environment, 2009, 113(10):2118-2129.

DOI:10.1016/j.rse.2009.05.012      URL     [本文引用: 1]

Fang C, Song K, Shang Y, et al.

Remote sensing of harmful algal blooms variability for Lake Hulun using adjusted FAI (AFAI) Algorithm

[J]. Journal of Environmental Informatics, 2018:54-68.

[本文引用: 1]

Otukei J R, Blaschke T.

Land cover change assessment using decision trees,support vector machines and maximum likelihood classification algorithms

[J]. International Journal of Applied Earth Observation and Geoinformation, 2010, 12:27-31.

DOI:10.1016/j.jag.2009.11.002      [本文引用: 1]

Land cover change assessment is one of the main applications of remote sensed data A number of pixel based classification algorithms have been developed over the past years for the analysis of remotely sensed data The most notable Include the maximum likelihood classifier (MLC). Support vector machines (SVMs) a:id the decision trees(DTs) The DTs in particular offer advantages not provided by other approahces They are computationally fast and make no statistical assumptions regarding the distribution Of data The challenge 10 using DTs lies in the determination of the "best" tree Structure and the decision boundaries Recent developments in the field of data mining have however, provided all alternative for overcoming the above shortcomings In this study, we analysed the potential of DTs as one technique for data mining for the analysis of the 1986 and 2001 Landsat TM and ETM+ datasets, respectively The results were compared with those obtained using SVMs. and MLC Overall. acceptable accuracies of over 85% were obtained in all the cases In general, the DTs performed better than both MLC and SVMs (C) 2009 Elsevier B V All rights reserved

李旭青, 刘世盟, 李龙, .

基于RF算法优选多时相特征的冬小麦空间分布自动解译

[J]. 农业机械学报, 2019, 50(6):218-225.

[本文引用: 1]

Li X Q, Liu S M, Li L, et al.

Automatic interpretation of spatial distribution of winter wheat based on random forest algorithm to optimize multi-temporal features

[J]. Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(6):218-225.

[本文引用: 1]

李苓苓, 潘耀忠, 张锦水, .

支持向量机与分类后验概率空间变化向量分析法相结合的冬小麦种植面积测量方法

[J]. 农业工程学报, 2010, 26(9):210-217.

[本文引用: 1]

Li L L, Pan Y Z, Zhang J S, et al.

Method of winter wheat planting area estimation based on support vector machine and post-classification changed vector analysis

[J]. Transactions of the Chinese Society of Agricultural Engineering, 2010, 26(9):210-217.

[本文引用: 1]

赵莲, 张锦水, 胡潭高, .

变端元混合像元分解冬小麦种植面积测量方法

[J]. 国土资源遥感, 2011, 23(1):66-72.doi:10.6046/gtzyyg.2011.01.13.

[本文引用: 1]

Zhao L, Zhang J S, Hu T G, et al.

The application of the dynamic endmember linear spectral unmixing model to winter wheat area estimation

[J]. Remote Sensing for Land and Resources, 2011, 23(1):66-72.doi:10.6046/gtzyyg.2011.01.13.

[本文引用: 1]

王怡人, 王胜强, 喻樾, .

一种提取南黄海浒苔的自适应阈值遥感算法

[J]. 遥感信息, 2021, 36(2):120-129.

[本文引用: 1]

Wang Y R, Wang S Q, Yu Y, et al.

An adaptive threshold algorithm for detecting ulva prolifera in southern Yellow Sea by remote sensing

[J]. Remote Sensing Information, 2021, 36(2):120-129.

[本文引用: 1]

Chen T W, Guestrin C.

XGBoost:A scalable tree boosting system

[C]// 22nd ACM SIGKDD International Conference.ACM, 2016.

[本文引用: 1]

卢雪梅, 苏华.

基于OLCI数据的福建近海悬浮物浓度遥感反演

[J]. 环境科学学报, 2020, 40(8):2819-2827.

[本文引用: 1]

Lu X M, Su H.

Retrieving total suspended matter concentration in Fujian coastal waters using OLCI data

[J]. Acta Scientiae Circumstantiae, 2020, 40(8):2819-2827.

[本文引用: 1]

黄宇, 潘励.

基于显著性图像与纹理特征的遥感影像云检测

[J]. 测绘地理信息, 2021, 46(2):16-19.

[本文引用: 1]

Huang Y, Pan L.

Cloud detection of remote sensing images based on significance maps and texture features

[J]. Journal of Geomatics, 2021, 46(2):16-19.

[本文引用: 1]

徐逸, 甄佳宁, 蒋侠朋, .

无人机遥感与XGBoost的红树林物种分类

[J]. 遥感学报, 2021, 25(3):737-752.

[本文引用: 1]

Xu Y, Zhen J N, Jiang X P, et al.

Mangrove species classification with UAV-based remote sensing data and XGBoost

[J]. National Remote Sensing Bulletin, 2021, 25(3):737-752.

[本文引用: 1]

李鹏, 冯存前, 许旭光, .

一种利用贝叶斯优化的弹道目标微动分类网络

[J]. 西安电子科技大学学报, 2021, 48(5):139-148.

[本文引用: 1]

Li P, Feng C Q, Xu X G, et al.

Ballistic target fretting classification network based on Bayesian optimization

[J]. Journal of Xidian University, 2021, 48(5):139-148.

[本文引用: 1]

孙淑文, 夏霆, 杨金艳, .

苏州湖泊水源地浮游植物群落特征及营养状况分析

[J]. 中国农村水利水电, 2020(8):51-55.

[本文引用: 1]

Sun S W, Xia T, Yang J Y, et al.

An analysis of the phytoplankton community characteristics and nutrition status in lake-type drinking water sources in Suzhou

[J]. China Rural Water and Hydropower, 2020(8):51-55.

[本文引用: 1]

刘瑞清, 李加林, 孙超, .

基于Sentinel-2遥感时间序列植被物候特征的盐城滨海湿地植被分类

[J]. 地理学报, 2021, 76(7):1680-1692.

DOI:10.11821/dlxb202107008      [本文引用: 1]

滨海湿地是具有重要功能的特殊海陆过渡带生态系统,精准获取滨海湿地植被时空分布信息具有重要意义。传统的湿地遥感观测研究集中于高空间、高光谱分辨率影像分类,往往受限于数据成本和覆盖范围,仅适用于小区域湿地监测。Sentinel-2A/B卫星影像时空分辨率高且免费共享,为大区域滨海湿地动态监测提供了可能。本文采用2018年Sentinel-2影像,提出像元级SAVI时间序列及双Logistic植被物候特征拟合重构模型,采用随机森林算法进行盐城滨海湿地植被分类,探讨Sentinel-2遥感时间序列植被物候特征分类方法的适用性。结果显示,分类总体精度达87.61%,Kappa系数为0.8358,分类结果与湿地实况相吻合,比常规单一时相分类精度总体提高19.57%。植被判别物候特征参数可为影像数据缺失或不足的滨海湿地分类提供不同植被的判别依据。研究表明,基于像元级时间序列植被物候特征的分类方法能实现植被群落混生带的精准分类以及对“异物同谱”植被的有效区分,对大区域滨海湿地植被分类具有很好的适用性,有效提高了滨海湿地植被分类精度。

Liu R Q, Li J L, Sun C, et al.

Classification of Yancheng coastal wetland vegetation based on vegetation phenological characteristics derived from Sentinel-2 time-series

[J]. Acta Geographica Sinica, 2021, 76(7):1680-1692.

DOI:10.11821/dlxb202107008      [本文引用: 1]

Coastal wetlands are special land-sea transitional ecosystems with important functions. It is of great significance to obtain the spatiotemporal distribution data of coastal wetland vegetation accurately. Previous wetland mapping studies focusing mainly on high spatial and spectral resolution images often have difficulties such as high data acquisition costs and limited coverage, so these methods are only suitable for small regions. Sentinel-2A/B satellite images with high spatial and temporal resolution and free sharing, make it possible for us to dynamically monitor large-area coastal wetlands. Based on Sentinel-2 images in 2018, this study proposed the pixel-level SAVI time series and double logistic vegetation phenological feature fitting reconstruction model, used a random forest algorithm to classify Yancheng coastal wetland vegetation in Jiangsu, East China, and then discussed the applicability of vegetation phenological characteristics (VPC) classification method. The results show that the overall accuracy of mapping based on VPC was 87.61%, which was 19.57% higher than that of the conventional single image classification, and the results were consistent with the actual distribution of wetlands. The vegetation discriminant phenological parameters can provide the basis for differentiating various types of vegetation, which can be applied to coastal wetland classification in the case of missing or insufficient image data. The phenological parameters have improved the method based on VPC, which can be applied to the rapid and accurate extraction of coastal vegetation and also provides new ideas to solve the problem of insufficient data in coastal wetland classification research. The method based on VPC in the pixel-level time series can achieve the accurate classification of the mixed zone of vegetation communities and the effective differentiation of "the same spectrum with different objects", which is applicable to the coastal wetland classification in large regions and improves the mapping accuracy of coastal wetland vegetation effectively.

Guo X J, Zhang C C, Luo W R, et al.

Urban impervious surface extraction based on multi-features and random forest

[J]. IEEE Access, 2020, 8:226609-226623.

DOI:10.1109/Access.6287639      URL     [本文引用: 1]

Bergstra J, Bardenet R, Bengio Y, et al.

Algorithms for hyper-parameter optimization

[J]. Advances in Neural Information Processing Systems, 2011, 24(24):2546-2554.

[本文引用: 1]

Tanaka R, Iwata H.

Bayesian optimization for genomic selection:A method for discovering the best genotype among a large number of candidates

[J]. Theoretical and Applied Genetics, 2017, 131(1):1-13.

DOI:10.1007/s00122-017-2954-9      URL     [本文引用: 1]

Seeger M.

Gaussian processes for machine learning

[J]. International Journal of Neural Systems, 2004, 14(2):69-106.

PMID:15112367      [本文引用: 1]

Gaussian processes (GPs) are natural generalisations of multivariate Gaussian random variables to infinite (countably or continuous) index sets. GPs have been applied in a large number of fields to a diverse range of ends, and very many deep theoretical analyses of various properties are available. This paper gives an introduction to Gaussian processes on a fairly elementary level with special emphasis on characteristics relevant in machine learning. It draws explicit connections to branches such as spline smoothing models and support vector machines in which similar ideas have been investigated. Gaussian process models are routinely used to solve hard machine learning problems. They are attractive because of their flexible non-parametric nature and computational simplicity. Treated within a Bayesian framework, very powerful statistical methods can be implemented which offer valid estimates of uncertainties in our predictions and generic model selection procedures cast as nonlinear optimization problems. Their main drawback of heavy computational scaling has recently been alleviated by the introduction of generic sparse approximations.13,78,31 The mathematical literature on GPs is large and often uses deep concepts which are not required to fully understand most machine learning applications. In this tutorial paper, we aim to present characteristics of GPs relevant to machine learning and to show up precise connections to other "kernel machines" popular in the community. Our focus is on a simple presentation, but references to more detailed sources are provided.

Colopy G W, Roberts S J, Clifton D A.

Bayesian optimization of personalized models for patient vital-sign monitoring

[J]. IEEE Journal of Biomedical and Health Informatics, 2018, 22(2):301.

DOI:10.1109/JBHI.2017.2751509      PMID:29505398      [本文引用: 2]

Gaussian process regression (GPR) provides a means to generate flexible personalized models of time series of patient vital signs. These models can perform useful clinical inference in ways that population-based models cannot. A challenge for the use of personalized models is that they must be amenable to a wide range of parameterizations, to accommodate the plausible physiology of any patient in the population. Additionally, optimal performance is typically achieved when models are regularized in light of the knowledge of the physiology of the individual patient. In this paper, we describe a method to build GP models with varying complexity (via covariance kernels) and regularization (via fixed priors over hyperparameters) on a patient-specific level, for the purpose of robust vital-sign forecasting. To this end, our results present evidence in support of two main hypotheses: 1) the use of patient-specific models can outperform population-based models for useful clinical tasks, such as vital-sign forecasting; and 2) the optimal values of (hyper)parameters of these models are best determined by sophisticated methods of optimization, due to high correlation between dimensions of the search space. The resulting models are sufficiently robust to inform clinicians of a patient's vital-sign trajectory and warn of imminent deterioration.

陈云, 戴锦芳.

基于遥感数据的太湖蓝藻水华信息识别方法

[J]. 湖泊科学, 2008, 20(2):179-183.

[本文引用: 1]

Chen Y, Dai J F.

Extraction methods of cyanobacteria bloom in Lake Taihu based on RS data

[J]. Journal of Lake Science, 2008, 20(2):179-183.

[本文引用: 1]

张东彦, 尹勋, 佘宝, .

多源卫星遥感数据监测巢湖蓝藻水华爆发研究

[J]. 红外与激光工程, 2019, 48(7):303-314.

[本文引用: 1]

Zhang D Y, Yin X, She B, et al.

Using multi-source satellite imagery data to monitor cyanobacterial blooms of Chaohu Lake

[J]. Infrared and Laser Engineering, 2019, 48(7):303-314.

[本文引用: 1]

刘海秋, 任恒奎, 牛鑫鑫, .

基于Sentinel-2遥感影像的巢湖蓝藻水华提取方法研究

[J]. 生态环境学报, 2021, 30(1):146-155.

DOI:10.16258/j.cnki.1674-5906.2021.01.017      [本文引用: 1]

可下载PDF全文。

Liu H Q, Ren H K, Niu X X, et al.

Extraction of cyanobacteria bloom in Chaohu Lake based on Sentinel-2 remote sensing images

[J]. Ecology and Environmental Sciences, 2021, 30(1):146-155.

[本文引用: 1]

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发