自然资源遥感, 2024, 36(3): 248-258 doi: 10.6046/zrzyyg.2023093

技术应用

基于多源卫星遥感影像的广西中南部地区甘蔗识别及产量预测

罗维,1, 李修华,1,2, 覃火娟1, 张木清2, 王泽平3, 蒋柱辉4

1.广西大学电气工程学院,南宁 530004

2.广西大学甘蔗生物学重点实验室,南宁 530004

3.广西农业科学院甘蔗研究所,南宁 530007

4.广西糖业集团有限公司,南宁 530022

Identification and yield prediction of sugarcane in the south-central part of Guangxi Zhuang Autonomous Region, China based on multi-source satellite-based remote sensing images

LUO Wei,1, LI Xiuhua,1,2, QIN Huojuan1, ZHANG Muqing2, WANG Zeping3, JIANG Zhuhui4

1. School of Electrical Engineering, Guangxi University, Nanning 530004, China

2. Guangxi Key Laboratory of Sugarcane Biology, Guangxi University, Nanning 530004, China

3. Sugarcane Research Institute, Guangxi Academy of Agricultural Sciences, Nanning 530007, China

4. Guangxi Sugar Industry Group, Nanning 530022, China

通讯作者: 李修华(1983-),女,博士,副教授,主要从事作物光谱检测、高通量作物表型分析和农业遥感研究。Email:lixh@gxu.edu.cn

责任编辑: 陈昊旻

收稿日期: 2023-04-17   修回日期: 2023-09-22  

基金资助: 广西重大科技专项项目“广西数字蔗田技术平台的构建与应用示范”(桂科AA22117004)
广西重大科技创新基地建设项目“广西甘蔗生物学重点实验室”(桂科2018-266-Z01)
国家自然科学基金项目“低空航拍图像融合田间环境及气象信息立体构建甘蔗长势、品质及产量预测模型”(31760342)

Received: 2023-04-17   Revised: 2023-09-22  

作者简介 About authors

罗 维(1994-),男,硕士研究生,主要研究方向为多光谱遥感卫星在农业的应用研究。Email: 2012391030@st.gxu.edu.cn

摘要

针对广西地区作物种类多、蔗区调查复杂度高,以及因天气多变导致的卫星遥感图像获取困难等问题,该文提出了一种基于Sentienl-2影像的语义分割改进算法用于自动识别甘蔗种植区域,并在多时相的Sentinel-2和Landsat8影像数据基础上,提出了一种代表性光谱特征提取方法构建甘蔗产量预测模型。首先在轻量级网络BiseNetV2中加入了高效通道注意力模块(efficient channel attention, ECA),构建了ECA-BiseNetV2模型识别蔗田的种植区域; 然后从识别到的甘蔗种植区域中提取不同时期的多种植被指数,利用线性回归模型将Landsat8植被指数转化为Sentinel-2植被指数,以减小Sentinel-2和Landsat8的数据差异; 接着对各蔗区、各生长周期内的植被指数时间序列数据进行三次曲线拟合,提取最大值作为代表性光谱特征; 最后使用了多种机器学习算法构建产量预测模型。结果表明,所提出模型总体精度达91.54%,甘蔗查准率达95.57%; 基于植被指数拟合最大值构建的决策树模型的测试集R2为0.792,比采用实际最大值构建的相应模型(R2=0.759)提升了4.3%。该方法可有效解决因天气问题导致的甘蔗关键生长期遥感图像缺失而难以准确构建产量预测模型的问题,展示出较强的应用性。

关键词: 语义分割; 植被指数; 甘蔗产量预测; 卫星遥感; 时间序列

Abstract

This study aims to solve the challenges faced in the prediction of sugarcane yield in Guangxi, such as varied crops, complex investigations in the sugarcane planting areas, and difficult acquisition of remote-sensing images caused by the changeable weather. To this end, an improved semantic segmentation algorithm based on Sentinel-2 images was proposed to automatically identify sugarcane planting areas, and an extraction method for representative spectral features was developed to build a sugarcane yield prediction model based on multi-temporal Sentinel-2 and Landsat8 images. First, an ECA-BiseNetV2 identification model for sugarcane planting areas was constructed by introducing an efficient channel attention (ECA) module into the BiseNetV2 lightweight unstructured network. As a result, the overall pixel classification accuracy reached up to 91.54%, and the precision for sugarcane pixel identification was up to 95.57%. Then, multiple vegetation indices of different growth periods of the identified sugarcane planting areas were extracted, and the Landsat8 image-derived vegetation indices were converted into Sentinel-2 image-based ones using a linear regression model to reduce the differences of the indices derived using images from the two satellites. Subsequently, after the fitting of time-series data of the extracted vegetation indices using a cubic curve, the maximum indices were obtained as the representative spectral features. Finally, a yield prediction model was built using multiple machine learning algorithms. The results indicate that the test set of the decision tree model built using the fitted maximum values of the vegetation indices yielded R? of up to 0.759, 4.3%, higher than that (0.792) of the model built using the available actual maximum values. Therefore, this method can effectively resolve the difficulty in developing an accurate sugarcane yield prediction model caused by changeable weather-induced lack of remote sensing images of sugarcane of the key growth periods.

Keywords: semantic segmentation; vegetation index; sugarcane yield prediction; satellite remote sensing; time-series

PDF (5523KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

罗维, 李修华, 覃火娟, 张木清, 王泽平, 蒋柱辉. 基于多源卫星遥感影像的广西中南部地区甘蔗识别及产量预测[J]. 自然资源遥感, 2024, 36(3): 248-258 doi:10.6046/zrzyyg.2023093

LUO Wei, LI Xiuhua, QIN Huojuan, ZHANG Muqing, WANG Zeping, JIANG Zhuhui. Identification and yield prediction of sugarcane in the south-central part of Guangxi Zhuang Autonomous Region, China based on multi-source satellite-based remote sensing images[J]. Remote Sensing for Land & Resources, 2024, 36(3): 248-258 doi:10.6046/zrzyyg.2023093

0 引言

截至2021—2022年榨季,广西地区甘蔗产量占全国产量的69%以上[1],在国家糖料供给体系中具有举足轻重的地位。研究基于卫星遥感影像的甘蔗产量预测对广西甘蔗种植业生产管理与贸易决策具有重要意义。

对于卫星遥感尺度的作物产量预测研究而言,从影像中识别和提取研究区域是开展后续工作的重要基础,使用无监督学习算法无需标注数据集即可对卫星遥感影像中目视差别较大的几种地物如植被、非植被及水体进行提取[2],但无监督学习的分类结果不具备标签,无法识别特定目标。因此,针对遥感影像特定目标的识别任务常通过有监督学习算法来实现。有监督的机器学习算法能够实现具有较高精度的单类或多类地物分类[3-5],但机器学习算法的可读性较差,难以提取遥感影像中更复杂的空间、纹理特征,需要通过大量实验确定用于分类的最优特征。而深度学习算法可从原始数据中捕获深层次的信息并自动选取出最优特征,比机器学习算法的分类效果更好[6],通过设计或改进算法,可从像素级别识别多种作物[7-10]。但深度学习算法通常具有较深的网络结构,计算成本高。近年来有越来越多的轻量级网络用于快速检测,其层次较浅,计算成本低,同时还兼顾了精度和性能优势,能以极高的效率完成面积广、影像大的分类任务[11-12]。不同于巴西、澳大利亚等以平原为主的甘蔗种植大国,我国广西属于山地丘陵性盆地地貌[13],地表植被种类多,甘蔗地块破碎、分散,近年来仅有少量针对中高空间分辨率卫星遥感影像以及对特定地区基于目视解译[14]或机器学习算法[15]进行的甘蔗种植区域识别研究。针对地形复杂、甘蔗区域植被多样的地表环境,研究准确高效的甘蔗种植区域识别模型是要解决的关键问题之一。

另一方面,植被指数是体现作物生长状态的重要指标,利用卫星遥感技术的作物产量预测研究大多基于植被指数开展。早期多光谱卫星如MODIS和SPOT等影像的空间分辨率较低,单个像素可能混合较多非甘蔗种植区域,由这些影像提取的植被指数通常需要结合地面传感器数据[16]或气象数据[17]才能粗略地估算出产量。随着卫星遥感技术的进步,利用中高空间分辨率的影像,如Sentinel-2和Landsat8等,可对甘蔗种植区域及其植被指数进行准确提取,并且进一步研究发现,特定时期的甘蔗植被指数与产量的线性关系强于其他时期[18],针对其他作物的研究也体现了这一规律[19-20]。另外,研究还发现,结合特定时期的多种植被指数往往能得到更佳的产量预测模型[21-22]。但广西属亚热带季风气候,年均降水量高达1 300~2 000 mm[23],多云、降雨天气较多,难以保证在特定时期获取可用的卫星遥感影像,由此导致甘蔗关键生长期卫星影像不足甚至缺失的问题。如何有效地通过多种卫星遥感影像及前后生长期的遥感影像来估计关键生长期的植被指数,是要解决的又一个关键问题。

针对上述问题,本文针对广西多个大型蔗区2013—2019年的宏观产量数据,通过获取空间分辨率较高的Sentinel-2和Landsat8卫星遥感图像,进行了以下研究来对甘蔗产量进行预测: ①在轻量级卷积神经网络BiseNetV2中加入高效通道注意力模块(efficient channel attention,ECA),构建ECA-BiseNetV2模型,在空间分辨率较高的Sentinel-2遥感影像中对生长中后期的甘蔗种植区域进行识别和提取,并计算甘蔗植被指数; ②针对不同卫星遥感影像波段参数不一致的问题,利用线性转化模型将Landsat8数据转化至Sentinel-2数据的基准,实现不同卫星源的数据融合; ③基于植被指数时间序列数据拟合生长曲线,并提取能反映甘蔗生长峰态的最大拟合值作为代表性特征参数,构建基于多种机器学习算法的甘蔗产量预测模型,从而选取最优模型。

1 研究区概况及数据源

1.1 研究区概况

本文的研究区域为广西壮族自治区境内的12个大型蔗区,分别分布于柳州、来宾、南宁、贵港、崇左、钦州、防城港、北海(图1)等地区(N21°32'~24°11', E106°22'~109°43')。广西地区的甘蔗生长季通常从3—4月开始,依次经历出苗期、分蘖期、伸长期和成熟期,9—10月生物量达到峰值,并开始进入糖分积累阶段,12月开始进入榨季,各地逐步开启砍收、糖料生产等工作,持续至来年的3月。

图1

图1   蔗区分布

Fig.1   Distribution of the selected sugarcane regions


1.2 数据来源

1.2.1 产量数据

蔗区1—12号的产量数据由当地糖厂提供。其中蔗区1—8号分别具有2013—2014到2019—2020这7个榨季的共56个产量数据,蔗区9—12号分别具有2017—2018和2018—2019这2个榨季的共8个产量数据,总计64个产量数据。由于各蔗区种植环境、气候等方面存在差异,甘蔗的产量数据也具有较大差异,基本统计情况如表1所示。

表1   甘蔗产量数据统计情况

Tab.1  Statistical information of sugarcane yields

样本数量最大值/
(t·hm-2)
最小值/
(t·hm-2)
均值/
(t·hm-2)
方差/
(t·hm-2)2
64161.6049.0685.94602.71

新窗口打开| 下载CSV


1.2.2 卫星数据选取

Landsat8卫星于2013年2月发射,重访周期为16 d,具有9个波段; Sentinel-2系列于2015年6月发射Sentinel-2A并于2017年3月发射Sentinel-2B,双星系统重访周期缩短为5 d,具有13个波段。2种卫星具有较高的时间分辨率和空间分辨率,适用于对大范围的作物生长状况进行监测。由于研究对象具有较长的时间跨度,因此本文选用了2013—2015年Landsat8以及2016—2019年Sentinel-2的卫星遥感影像。受天气的影响,每个蔗区每年的可用遥感影像数量在5~12幅不等,主要分布在4—12月。对比2种卫星各波段参数,选取蓝、绿、红、近红外4个对植被敏感的波段,具体参数如表2所示。

表2   卫星遥感影像选取的波段参数

Tab.2  Parameters of the selected bands from satellite images

敏感
波段
Landsat8Sentinel-2
波长/nm分辨率/m波长/nm分辨率/m
蓝光450~5103049210
绿光530~5903056010
红光640~6703066510
近红外850~8803083310

新窗口打开| 下载CSV


2 研究方法

2.1 基于轻量级网络的甘蔗种植区域识别

2.1.1 构建数据集

为准确识别甘蔗种植区域,本研究从蔗区1—3号中随机选取子区块对种植区域进行标注,构建数据集。图2显示了蔗区1号某区块的幼苗期、快速伸长期、伸长期末期以及榨季这4个典型时期的遥感影像。从图2中可以看出,伸长期末期的甘蔗冠层覆盖度最高,在影像中呈较为均匀的深绿色,与水体、树木、建筑等其他地表覆盖物的差异最为明显。并且,该时期(9—10月)晴朗天气较多,更容易获得高质量的遥感影像。因此,本研究将该时期作为甘蔗种植区域识别的最佳时期。从蔗区1—3号中随机选取不同年份下9—10月的4幅低云量Sentinel-2卫星遥感影像用于构建甘蔗种植区域识别模型的数据集,其基本信息见表3

图2

图2   不同时期某蔗区的卫星遥感影像

Fig.2   Satellite images of a sugarcane planting region in different growth periods


表3   卫星遥感影像基本信息

Tab.3  Basic information of the satellite remote sensing images

影像编号地理位置成像时间云量/%像素分辨率/m
T48QZL蔗区1号2018-10-03<510
T48QYL蔗区1号2019-09-28<510
T49QBF蔗区2号2019-09-28<510
T48QYK蔗区3号2020-10-22<510

新窗口打开| 下载CSV


蔗区1号的横州市良圻农场为本研究提供了甘蔗地块的中心坐标信息,共包含11 682个甘蔗地块中心点的坐标,其分布情况如图3所示。但由于缺乏边界信息,还需进一步人工标注边界。蔗区2号和蔗区3号缺少地块坐标信息,因此使用了空间分辨率较高的Google Earth卫星影像(空间分辨率达到0.5 m),经地理校正对齐后作为辅助标注图像,再结合甘蔗冠层的颜色、纹理特征对蔗区进行目视解译,以扩充数据集。

图3

图3   良圻农场甘蔗地块中心坐标点分布情况

Fig.3   Central coordinate distribution of the sugarcane fields in Liangqi farm


最终的原始数据集包括159张300像素×300像素的Sentinel-2卫星遥感影像,累计标注了2 649个甘蔗种植区域。其中,根据地块中心坐标标注所得的影像为100张,标注区域数量为1 578个,由谷歌地球卫星目视解译标注的影像59张,标注区域1 071个。通过对影像进行旋转、镜像等操作进一步扩充数据集,共获得636张带有标注信息的影像数据集。将该数据集以6∶2∶2的比例划分为训练集、验证集和测试集。

2.1.2 语义分割网络模型

复杂的卷积神经网络如FCN[24]和U-Net[25]等通常具有较深的层次,对计算机硬件性能的要求较高,由于本文仅需对甘蔗一种类别进行识别,所以使用分类精度高且对硬件性能要求较低的轻量级网络BiseNetV2[26]作为基础,再加入ECA模块[27]对网络进行改进。ECA的基本结构如图4所示,图中H,WC分别为影像高、宽和通道数。该模块设计了一个自适应动态卷积核来捕获通道之间的信息,以获得不同通道的权重值,并由Sigmoid输出描述权重的特征图。自适应动态卷积操作的步长为1,因此不会改变输出特征图的尺寸。ECA模块的引入能使模型以较小的计算代价对输入特征的关键部分进行加权,并降低无关特征的权重。

图4

图4   注意力模块结构

Fig.4   Architecture of the efficient channel attention module


改进的ECA-BiseNetV2网络结构如图5所示。其主体为二分支架构,包含一个传统的卷积分支和一个可分离卷积分支,可将不同尺度的特征图进行融合,从而同时获得精细和全局的语义信息。此外,ECA-BiseNetV2还设计了一个渐进式上采样模块,在上采样时具有更好的性能和速度。

图5

图5   ECA-BiseNetV2网络结构

Fig.5   Network architecture of ECA-BiseNetV2


为提升模型对细节识别的准确度,在ECA-BiseNetV2的语义分支主干模块和上下文模块中引入了ECA模块,可以在语义特征输入和输出时,使语义分支聚焦于特征,帮助模型更好地关注重要的语义信息,提高语义分割的准确性。本次实验中,将ECA-BiseNetV2网络的初始学习率设置为0.01,优化器选择sgd,损失函数选择CrossEntropyLoss,迭代次数为3 000次,每次迭代的批次大小为4。另选取基础网络BiseNetV2以及较为主流的U-Net,SegNet[28],DeepLabV3+[29],Fast-SCNN[30]和BiseNetV1[31]网络构建对照模型,训练参数同ECA-BiseNetV2网络。

2.2 植被指数提取及变化趋势拟合

2.2.1 植被指数提取

为提取各蔗区不同时期的甘蔗植被指数,将ECA-BiseNetV2语义分割模型应用于各蔗区、各年份的9—10月的Sentinel-2低云量影像中,以得到各蔗区甘蔗种植区域的分类结果。进一步将分类结果转换为带地理信息的掩模文件(图6)应用到其他时期及其他类型的遥感影像中以确定采样区域。考虑到蔗区的作物类型通常不会发生变化,2013—2015年的Landsat8影像直接采用了2015年或2016年的基于Sentinel-2影像的分类结果进行掩模。

图6

图6   分类结果转换掩模示意图

Fig.6   Diagram of classification results convert to mask


通过掩模提取不同时期卫星影像的感兴趣区域(region of interest, ROI),并统计ROI中各波段的像素平均值,计算植被指数。本文选取了6种常见的植被指数,包括比例植被指数(ratio vegetation index,RVI)、增强型植被指数(enhanced vegetation index,EVI)、耐大气植被指数(atmospherically resistant vegetation index,ARVI)、归一化植被指数(normalized difference vegetation index,NDVI)、改良土壤调整植被指数(modified soil adjusted vegetation index,MSAVI)、优化的土壤调整植被指数(optimized soil adjusted vegetation index,OSAVI),如表4所示,其中BLUE,REDNIR分别表示蓝、红和近红外波段的像素平均值。

表4   植被指数及计算公式

Tab.4  Vegetation indices and calculation formulas

植被指数计算公式
RVINIRRED
EVI2.5×(NIR-RED)NIR+6RED-7.5BLUE+1
ARVINIR-(2RED-BLUE)NIR+(2RED-BLUE)
NDVINIR-REDNIR+RED
MSAVI2(NIR+1)-2(NIR+1)2-8(NIR-RED)2
OSAVINIR-REDNIR+RED+0.16

新窗口打开| 下载CSV


2.2.2 卫星数据融合

Landsat8和Sentinel-2的传感器、轨道等具有一定差异,二者的特征波段也并不完全一致,进而导致同一时期、同一区域提取得到的植被指数存在差异。为降低这种差异,抽样选取了4组拍摄时间和空间尽可能一致且云量低的Sentinel-2和Landsat8影像(表5),通过对二者的植被指数进行分析,构建转化模型。

表5   4组影像成像信息

Tab.5  Imaging information of four sets

组别卫星成像时间(格林尼治标准时间)太阳方位角/(°)
第1组Sentinel-22019-09-23 03:31:36.497 072142.284 368 98
Landsat82019-09-23 03:17:09.454 461134.876 687 23
第2组Sentinel-22019-09-25 03:21:28.373 447142.049 097 88
Landsat82019-09-25 03:04:48.402 126136.096 298 00
第3组Sentinel-22019-11-10 03:41:53.132 702160.935 621 44
Landsat82019-11-10 03:17:36.267 949152.188 601 14
第4组Sentinel-22020-04-27 03:21:37.616 403112.802 340 64
Landsat82020-04-27 03:10:09.707 394108.816 244 32

新窗口打开| 下载CSV


在每组影像中分别选取采样区域面积为1 km2以上的多个采样区块,4组影像共计采集了770组数据用于研究波段及植被指数差异。将数据集按照7∶3的比例划分为训练集和测试集,使用线性回归算法建立二者的转换模型,将Landsat8数据转化至Sentinel-2数据基准下。

2.2.3 使用三次曲线方程拟合植被指数时序数据

为建立更具泛化能力的甘蔗产量预测模型,需要获取多地区、多年份的具有一致性和代表性的光谱特征数据。常规方法通常是选取某一个或多个特定时期的光谱特征作为自变量。但是,广西地区因其气候原因难以保证特定时期遥感影像的可用性,且不同地区的甘蔗生长起始时间及速度均有差异,单纯依靠获取的有限影像难以获得准确反映甘蔗特定生长期的代表性光谱特征。

甘蔗作物会经历生物量累积阶段和糖分累积阶段: 生物量累积阶段冠层越来越密集,大约9月下旬—10月上旬甘蔗生长达到饱和,随之进入糖分累积阶段,叶片逐渐发黄衰老,植被指数呈现缓慢上升和较快速下降的变化特点。由于12月上旬—次年2月下旬是甘蔗收割工作的高峰期,为避免收割工作对植被指数造成的影响,选取3—11月份的植被指数时间序列数据作为研究对象,通过三次曲线方程拟合得到生长周期内甘蔗植被指数的连续变化趋势,并提取拟合最大值作为特征光谱,以克服影像缺失、生长速度不一致等对光谱特征提取带来的不利影响。公式为:

y=ax3+bx2+cx+d

式中: x为当年的自然日; y为植被指数拟合值; a,b,c,d均为模型的参数。

2.3 基于机器学习的产量预测模型

考虑到研究的时间维度上包含了2种卫星遥感影像,首先将前3 a的Landsat8植被指数转化至Sentinel-2影像基准下; 然后选取每个生长周期内的植被指数最大值(包括可用最大值和拟合最大值)与产量进行相关性分析; 接着选择与产量相关性较高的多个指数作为特征变量,分别使用逻辑回归[32]、支持向量机[33]、决策树[34]和随机森林[35]算法构建产量预测模型; 最终确定最优模型。

3 结果分析

3.1 模型分类效果评估

各网络训练过程的损失函数及测试集中总体精度变化曲线如图7所示。可以看出,所有模型的总体精度在经过2 500次迭代后均趋于稳定。BiseNet-V2,ECA-BiseNetV2,DeepLabV3+的总体精度较高,均达到了90%以上,而U-Net,SegNet,Fast-SCNN的总体精度相对较低。保存各网络的最佳模型,其评价指标情况如表6所示。

图7

图7   训练过程损失函数值及测试集中总体精度变化曲线

Fig.7   Curves of loss function during training and overall accuracy in the test set


表6   各网络最佳模型的评价指标

Tab.6  Evaluating indicators of the best models

模型Kappa总体精
度/%
查准
率/%
查全
率/%
单张推理
时间/ms
BiseNetV20.798 690.4394.6289.8748
ECA-BiseNetV20.806 991.5495.5790.7850
U-Net0.681 583.6794.6177.13101
SegNet0.642 781.9595.6973.8495
DeepLabV3+0.801 791.0994.9090.36105
Fast-SCNN0.675 284.1992.3281.5239
BiseNetV10.744 887.6894.2785.5155

新窗口打开| 下载CSV


SegNet对甘蔗像素的查准率最高,达95.69%,但其查全率仅为73.84%,说明SegNet正确识别出的甘蔗面积较小。同为复杂网络的U-Net模型表现也不佳,可能原因是其具有较多的卷积下采样步骤,对本文所使用的低空间分辨率影像而言会更容易丢失细节。Fast-SCNN的单张推理时间最短,但其他精度指标偏低。DeepLabV3+具备较高的总体精度,但推理时间偏长。本文提出的ECA-BiseNetV2和其基础网络BiseNetV2对甘蔗种植区域的识别精度均较高,ECA-BiseNetV2相较于BiseNetV2在各种评价指标中均具有一定程度的提升,Kappa系数、总体精度、查准率以及查全率分别提升了1.03%,1.23%,1.00%以及1.01%,而推理时间没有明显变长,说明改进后的语义分支仍具有较高的性能。2种模型的输出样例如图8所示,其中绿色部分表示甘蔗种植区域的分类结果,红色部分为非甘蔗种植区域的分类结果。A区块为一处地表覆盖物较为多样、甘蔗种植区域面积较小的区域。BiseNetV2成功识别出了该区块有甘蔗种植区域,但识别结果相对保守,略小于实际区域; 而ECA-BiseNetV2模型对此区块的蔗地识别更精准,分类区域的形状更接近原图影像。B和C区块主要为非甘蔗种植区域,ECA-BiseNetV2模型输出的分类形状也更符合实际。

图8

图8   BiseNetV2与ECA-BiseNetV2的输出样例对比

Fig.8   Output results of BiseNetV2 and ECA-BiseNetV2


图9展示了ECA-BiseNetV2模型对蔗区的局部识别情况。由于使用分类模型的目的是在尽可能大的区域内识别出属于甘蔗类别的像素,较高的查准率说明由该模型识别得到的甘蔗像素绝大部分符合真值,故ECA-BiseNetV2模型满足了从遥感影像中获取大范围甘蔗种植区域的需求。

图9

图9   ECA-BiseNetV2模型识别效果示意图

Fig.9   ECA-BiseNetV2 identification diagram


3.2 卫星数据融合及三次曲线方程拟合效果

Landsat8与Sentinel-2各波段采样值的差异分析如表7所示,评价指标包括决定系数R2和平均相对误差(mean relative error,MRE)。为测试Landsat8植被指数转化至Sentinel-2标准下的植被指数的线性转化模型效果,采用由训练集得到的线性方程对测试集的Landsat8植被指数进行转化并与对应采样区块的Sentinel-2植被指数进行对比。各植被指数的线性转化模型及其在测试集上的转化结果如表8所示,表中x表示Landsat8植被指数,y为转化为Sentinel-2标准后的植被指数,R2为转化后的Landsat8植被指数与Sentinel-2植被指数之间的决定系数,MRE分别包含了转化前、后的Landsat8植被指数与Sentinel-2的植被指数的相对误差。

表7   Landsat8与Sentinel-2波段值差异分析

Tab.7  Difference analysis of the values of Landsat8 and Sentinel-2 bands

波段R2MRE/%
蓝光0.88512.26
绿光0.9504.96
红光0.9775.37
近红外0.9252.80

新窗口打开| 下载CSV


表8   各植被指数的线性转化模型及在测试集中的转化结果

Tab.8  The linear transformation models of different vegetation indices and their transformation results in test sets

植被指数线性转化模型R2MRE/%
转化前转化后
RVIy = 0.976 9x-0.200 90.9946.712.82
NDVIy = 1.044 7x-0.046 90.9962.871.03
EVIy = 0.961 7x+0.032 40.9454.663.84
MSAVIy = 0.968 9x+0.026 60.9851.090.99
ARVIy = 1.029 3x-0.014 60.9992.532.43
OSAVIy = 1.014 8x-0.013 40.9931.901.16

新窗口打开| 下载CSV


结合表7表8可发现,2种卫星的植被指数之间的差异要明显小于原始波段值之间的差异,并且Landsat8植被指数经转化后,与Sentinel-2植被指数的MRE更低,数据更一致。因此使用线性转化模型可有效提高不同卫星影像数据的一致性。

将12个蔗区所有的Landsat8植被指数转化成Sentinel-2标准下的植被指数,然后对各蔗区各年份按时间排列的6种植被指数序列数据进行三次曲线拟合。每种植被指数分别得到57条拟合曲线(剔除了7条异常数据),6种植被指数共342条。以2018年蔗区1—4号的NDVI为例,三次曲线方程的拟合结果如图10所示。可以看出,各拟合曲线具有较为一致的变化趋势,符合甘蔗生长规律。

图10

图10   2014年蔗区1—4号的NDVI拟合效果

Fig.10   Fitting results of NDVI in 2014 for sugarcane region 1—4


将曲线方程在具有影像数据的时间节点上的拟合值与实际值进行误差分析,结果如表9所示。可以看出,拟合值与实际值之间的R2均在0.6以上,最高达到了0.953,而MRE最高仅为3.57%,反映出该拟合方式具有良好的通用性,可以较好地还原甘蔗在不同生长期的植被指数。

表9   曲线方程拟合值与时序数据的误差分析

Tab.9  Error analysis of curve equations fitted values and time series data

植被指数R2分布范围MRE分布范围/%
RVI0.706~0.9340.69~3.57
NDVI0.612~0.8490.43~3.29
EVI0.657~0.8971.67~2.98
MSAVI0.732~0.9530.35~1.66
ARVI0.682~0.8610.89~2.72
OSAVI0.714~0.9080.25~1.96

新窗口打开| 下载CSV


3.3 产量预测模型

3.3.1 使用植被指数实际最大值建模

甘蔗生长的饱和时期是产量形成的关键时期,且通常在这一时期植被指数达到最大值。首先从甘蔗各生长周期的可用时序影像数据中挑选出实际的植被指数最大值,并与产量进行相关性分析,结果如表10所示。EVI与产量的相关性较弱,但RVI,NDVI和OSAVI与产量的Pearson相关系数达到了0.7以上,其中OSAVI达到了0.756,显示出较好的线性相关关系。

表10   各植被指数实际最大值与产量的相关性分析

Tab.10  Correlation analysis between actual maximum values of vegetation indices and yields

植被指数Pearson相关系数
RVI0.725
NDVI0.718
EVI0.424
MSAVI0.657
ARVI0.504
OSAVI0.756

新窗口打开| 下载CSV


选择与产量相关性较高的RVI,NDVI,MSAVI,ARVI和OSAVI作为特征变量,以8∶2的比例将数据集划分为训练集和测试集,构建了4种产量预测模型,建模结果如表11所示。

表11   使用实际最大值的各模型训练效果

Tab.11  Training results of each model using the actual maximum values

模型训练集测试集
MRE/%R2MRE/%R2
逻辑回归8.230.62210.340.621
支持向量机8.870.5865.750.561
决策树3.740.7779.030.759
随机森林3.790.76910.800.758

新窗口打开| 下载CSV


在测试集中,逻辑回归和支持向量机模型的R2分别为0.621和0.561,可较好地解释数据的变异性; 决策树和随机森林模型的R2分别达到0.759和0.758,能更好地解释数据的变异性,其中决策树模型的MRE更低,仅为9.03%,说明使用决策树模型能对甘蔗产量作出更准确的预测。

3.3.2 使用曲线方程的拟合最大值建模

进一步选取各生长周期根据时序植被指数拟合所得的三次曲线的最大值作为理论最大值,也称为拟合最大值,与产量进行相关性分析,结果如表12所示。可以看出,相较于表10中的实际最大值与产量的相关性而言,各植被指数的拟合最大值与产量的相关性均有一定的提升,其中NDVI拟合最大值与产量的Pearson相关系数达0.831,表现为极强的线性关系,RVI和OSAVI与产量的Pearson相关系数也达到了0.7以上。

表12   植被指数拟合最大值与产量的相关性分析

Tab.12  Correlation analysis between the maximum fitting values of vegetation index and yields

植被指数Pearson相关系数
RVI0.773
NDVI0.831
EVI0.444
MSAVI0.632
ARVI0.535
OSAVI0.757

新窗口打开| 下载CSV


将RVI,NDVI,MSAVI,ARVI和OSAVI的拟合最大值作为输入,同样构建了4种产量预测模型,预测结果如表13所示。可以看出,相比使用植被指数实际最大值建立的预测模型,使用拟合最大值构建的模型精度基本上都有所提高,其中决策树的测试集R2达0.792,为所有模型中最高,随机森林模型的R2也达到了0.774。基于拟合最大值构建的逻辑回归、决策树和随机森林预测模型在测试集中的MRE更低,说明采用拟合最大值的方法是科学合理的,具备更高的应用价值。

表13   使用拟合最大值的各模型训练结果

Tab.13  Training results of each model using the fitted maximum values

模型训练集测试集
MRE/%R2MRE/%R2
逻辑回归9.100.7166.140.697
支持向量机9.300.5618.840.559
决策树3.650.8208.590.792
随机森林3.560.7987.340.774

新窗口打开| 下载CSV


4 结论

1)提出了一种改进的轻量级分割网络ECA-BiseNetV2,在9—10月的Sentinel-2卫星影像中能准确识别甘蔗种植区域,查准率达到了95.57%,可大大提高蔗田调查效率,有效扩大了采样区域。

2)使用线性转化模型实现了Sentinel-2和Landsat8数据的转化,提供了一种简单有效的方法解决多源卫星遥感图像的数据差异问题; 另外,基于植被指数的时间序列数据构建的三次曲线拟合模型可较好地拟合缺失卫星遥感图像的关键生长期的植被指数。

3)由多个植被指数的拟合最大值构建的产量预测模型的精度比由可用的实际最大值构建的模型精度更高,其中表现最好的决策树模型的测试集R2从0.759提高到了0.792,提升了4.3%,可有效解决因天气问题导致的甘蔗关键生长期遥感图像缺失而难以准确构建产量预测模型的问题,展示出较强的应用性。

参考文献

邓宇驰, 刘晓婷, 黄莹, .

广西崇左蔗区2022年糖料蔗生产调查

[J]. 中国种业, 2022(10):48-51.

[本文引用: 1]

Deng Y C, Liu X T, Huang Y, et al.

Investigation on sugar cane production in Chongzuo sugarcane area of Guangxi in 2022

[J]. China Seed Industry, 2022(10):48-51.

[本文引用: 1]

Taufik A, Syed Ahmad S S, Azmi E F.

Classification of Landsat8 satellite data using unsupervised methods

[C]// Piuri V,Balas V,Borah S,et al.Intelligent and Interactive Computing.Singapore:Springer, 2019:275-284.

[本文引用: 1]

陈洋波, 窦鹏, 张涛.

基于Landsat的多分类器集成遥感影像分类

[J]. 测绘科学, 2018, 43(8):97-103,109.

[本文引用: 1]

Chen Y B, Dou P, Zhang T.

Multiple classifiers integrated classification based on Landsat imagery

[J]. Science of Surveying and Mapping, 2018, 43(8):97-103,109.

[本文引用: 1]

栗旭升, 李虎, 陈冬花, .

联合GF-5与GF-6卫星数据的多分类器组合亚热带树种识别

[J]. 林业科学, 2020, 56(10):93-104.

[本文引用: 1]

Li X S, Li H, Chen D H, et al.

Multiple classifiers combination method for tree species identification based on GF-5 and GF-6

[J]. Scientia Silvae Sinicae, 2020, 56(10):93-104.

[本文引用: 1]

吴玉鑫, 王卷乐, 韩保民, .

基于时空谱特征的墨脱县森林分类方法与实现

[J]. 自然资源遥感, 2023, 35(1):180-188.doi:10.6046/zrzyyg.2022016.

[本文引用: 1]

Wu Y X, Wang J L, Han B M, et al.

Forest classification for Motuo County:A method based on spatio-temporal-spectral characteristics

[J]. Remote Sensing for Natural Resources, 2023, 35(1):180-188.doi:10.6046/zrzyyg.2022016.

[本文引用: 1]

李玉峰, 林辉.

基于CNN的多光谱遥感图像地物覆盖分类

[J]. 微处理机, 2019, 40(1):43-48.

[本文引用: 1]

Li Y F, Lin H.

Multi-spectral remote sensing image classification of ground coverage based on CNN

[J]. Microprocessors, 2019, 40(1):43-48.

[本文引用: 1]

Nascimento B H, Garcia F L M, Schwieder M, et al.

Detailed agricultural land classification in the Brazilian cerrado based on phenological information from dense satellite image time series

[J]. International Journal of Applied Earth Observation and Geoinformation, 2019, 82:101872.

[本文引用: 1]

Liu Q, Basu S, Ganguly S, et al.

DeepSat V2:Feature augmented convolutional neural nets for satellite image classification

[J]. Remote Sensing Letters, 2020, 11(2):156-165.

[本文引用: 1]

姜楠, 张雪红, 汶建龙, .

基于高分六号宽幅影像的油菜种植分布区域提取方法

[J]. 地球信息科学学报, 2021, 23(12):2275-2291.

DOI:10.12082/dqxxkx.2021.210233      [本文引用: 1]

油菜作为我国主要的农业经济作物及食用油的主要来源,及时、准确地获取其种植分布信息,是全面掌握油菜种植状况、加强生产管理、优化作物种植空间格局的重要依据。高分六号(GF-6)的宽视场(Wide Field View,WFV)传感器在可见光-近红外波段基础上增设了2个红边波段、1个黄波段和1个紫波段,为油菜遥感识别提供了更加丰富的光谱信息,进而相较于蓝、绿、红、近红外4个&#x0201c;传统波段&#x0201d;的识别精度有所提升。本文以油菜开花期内两景不同时相GF-6 WFV影像拼接图像作为数据源,选择油菜生产优势区的河南省固始县为研究区,针对油菜同其他地物的&#x0201c;异物同谱&#x0201d;现象以及不同生长阶段油菜的&#x0201c;同物异谱&#x0201d;现象,利用油菜开花期独特的反射光谱特征,结合均值间标准化近距离提出了NDSI<sub>28</sub>、S<sub>34</sub>、NDSI<sub>23</sub>和NDSI<sub>46</sub>共4个光谱指数,并由此构建油菜种植区域提取的决策树模型。研究结果表明,基于4个指数组合构建的决策树模型对油菜种植分布信息的提取达到了较好的效果,总体精度为96.17%,与随机森林、支持向量机、最大似然法相比分别高出0.31%、0.88%和1.24%;制图精度方面,决策树法为98.15%,比随机森林、支持向量机、最大似然法分别高4.72%、4.21%和5.59%;对于用户精度,决策树法为86.89%,较随机森林、最大似然法分别低2.2%和1.63%,比支持向量机高0.11%。由此说明,GF-6 WFV数据中的新增波段极大地丰富了其光谱信息,使其在包括油菜在内的农作物种植分布信息提取中具有独特的优势和巨大潜力。

Jiang N, Zhang X H, Wen J L, et al.

Extraction method of rapeseed planting distribution area based on GF-6 WFV image

[J]. Journal of Geo-Information Science, 2021, 23(12):2275-2291.

[本文引用: 1]

伊尔潘·艾尼瓦尔, 买买提·沙吾提, 买合木提·巴拉提.

基于GF-2影像和Unet模型的棉花分布识别

[J]. 自然资源遥感, 2022, 34(2):242-250.doi:10.6046/zrzyyg.2021135.

[本文引用: 1]

Erpaw A, Mamat S, Maihemuti B.

Recognition of cotton distribution based on GF-2 images and Unet model

[J]. Remote Sensing for Natural Resources, 2022, 34(2):242-250.doi:10.6046/zrzyyg.2021135.

[本文引用: 1]

Poortinga A, Thwal N S, Khanal N, et al.

Mapping sugarcane in Thailand using transfer learning,a lightweight convolutional neural network,NICFI high resolution satellite imagery and Google Earth Engine

[J]. ISPRS Open Journal of Photogrammetry and Remote Sensing, 2021, 1:100003.

[本文引用: 1]

Shang S, Zhang J, Wang X, et al.

Faster and lighter meteorological satellite image classification by a lightweight channel-dilation-concatenation net

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2023, 16:2301-2317.

[本文引用: 1]

黄冬梅, 陈燕丽, 莫建飞, .

广西典型地貌植被覆盖度随地形的变化特征

[J]. 广西林业科学, 2022, 51(5):626-633.

DOI:10.19692/j.issn.1006-1126.20220505      [本文引用: 1]

为了解广西植被覆盖度不同地貌下的时空演变特征及植被覆盖度与地形的关系,促进生态环境建设健康发展,利用2000 &#x02014; 2018年MODIS NDVI长时间序列数据,分析广西喀斯特石山区和山地丘陵区植被覆盖度年代际时空演变特征和两地植被覆盖度随海拔、坡度和坡向变化的差异。结果表明,2000 &#x02014; 2018年,广西喀斯特石山区和山地丘陵区植被覆盖度改善程度均较大;喀斯特石山区植被覆盖度增长速率为8.36%/10 a,山地丘陵区为7.81%/10 a。两地植被覆盖度随海拔、坡度和坡向的变化特征较一致,且年份差异较小。两地植被覆盖度在较低海拔区均随海拔升高而增加;不同海拔等级植被覆盖度均明显增加,喀斯特石山区增幅更大;喀斯特石山区植被覆盖度最高的海拔为600 ~ 1 000 m,山地丘陵区为1 000 ~ 1 400 m;两地植被覆盖度在海拔小于200 m时差异最大,600 ~ 1 000 m时最小。两地植被覆盖度在坡度5° ~ 10°时均随坡度增加而增加;坡度大于10°时,山地丘陵区变化更稳定。山地丘陵区不同等级坡度的植被覆盖度均高于喀斯特石山区;两地植被覆盖度在坡度15°~25°时差异最大,坡度大于25°时差异最小。两地植被覆盖度均在南坡(坡向135°~180°)最高;喀斯特石山区在西坡(坡向270°~315°)最低,山地丘陵区在西坡(坡向225°~270°)最低;两地植被覆盖度在东坡(坡向90° ~135°)差异最大,西坡(坡向225°~270°)最小。

Huang D M, Chen Y L, Mo J F, et al.

Vegetation coverage change characteristics of typical landforms in Guangxi with topography

[J]. Guangxi Forestry Science, 2022, 51(5):626-633.

DOI:10.19692/j.issn.1006-1126.20220505      [本文引用: 1]

In order to understand spatial-temporal evolution characteristics of vegetation coverage in different landforms of Guangxi and relationship between vegetation coverage and topography, and promote healthy development of ecological environment construction, based on MODIS NDVI long-term series data from 2000 to 2018, decadal spatial-temporal evolution characteristics of vegetation coverage in Karst rocky area and mountain hilly area of Guangxi and differences of vegetation coverage changes with altitude, slope and aspect between two regions were analyzed. Results showed that improvement degree of vegetation coverage was greater in Karst rocky area than that in mountain hilly area, with growth rate of 8.36%/10 a in Karst rocky area and 7.81%/10 a in mountain hilly area, respectively. Change characteristics of vegetation coverage with altitude, slope and aspect in two regions were relatively consistent, and differences among years were small. Vegetation coverage in two regions increased with increase of altitude at low altitude. Vegetation coverage at different altitude levels in two regions increased significantly, and increase in Karst rocky area was greater. Altitude with the highest vegetation coverage was 600 - 1 000 m in Karst rocky area and was 1 000 - 1 400 m in mountain hilly area. Difference of vegetation coverage between two regions was the largest when altitude was less than 200 m and was the smallest when altitude was 600 - 1 000 m. Vegetation coverage of two regions increased with increase of slope at slope of 5° - 10°. When slope was greater than 10°, change of vegetation coverage in mountain hilly area was more stable. Vegetation coverage of mountain hilly area at different slope degrees were higher than those of Karst rocky area. Difference of vegetation coverage between two regions was the largest when slopes was 15° - 25° and was the smallest when slope was greater than 25°. Vegetation coverage were the highest on southern slope (135° - 180° aspect) in two regions. Vegetation coverage was the lowest on west slope (270° - 315° aspect) in Karst rocky area and was the lowest on west slope (225° - 270° aspect) in mountain hilly area. Difference of vegetation coverage between two regions was the largest on east slope (90° - 135° aspect) and was the smallest on west slope (225° - 270° aspect).

黄基杰.

甘蔗地快速识别的样本库建设——以广西崇左为例

[J]. 南方国土资源, 2019(4):45-47.

[本文引用: 1]

Huang J J.

Construction of sample database for rapid identification of sugarcane fields:A case study of Chongzuo,Guangxi

[J]. Nanfang Guotu Ziyuan, 2019(4):45-47.

[本文引用: 1]

Wang M, Liu Z, Ali Baig M H, et al.

Mapping sugarcane in complex landscapes by integrating multi-temporal Sentinel-2 images and machine learning algorithms

[J]. Land Use Policy, 2019, 88:104190.

[本文引用: 1]

Lofton J, Tubana B S, Kanke Y, et al.

Estimating sugarcane yield potential using an in-season determination of normalized difference vegetative index

[J]. Sensors, 2012, 12(6):7529-7547.

DOI:10.3390/s120607529      PMID:22969359      [本文引用: 1]

Estimating crop yield using remote sensing techniques has proven to be successful. However, sugarcane possesses unique characteristics; such as, a multi-year cropping cycle and plant height-limiting for midseason fertilizer application timing. Our study objective was to determine if sugarcane yield potential could be estimated using an in-season estimation of normalized difference vegetative index (NDVI). Sensor readings were taken using the GreenSeeker® handheld sensor from 2008 to 2011 in St. Gabriel and Jeanerette, LA, USA. In-season estimates of yield (INSEY) values were calculated by dividing NDVI by thermal variables. Optimum timing for estimating sugarcane yield was between 601-750 GDD. In-season estimated yield values improved the yield potential (YP) model compared to using NDVI. Generally, INSEY value showed a positive exponential relationship with yield (r(2) values 0.48 and 0.42 for cane tonnage and sugar yield, respectively). When models were separated based on canopy structure there was an increase the strength of the relationship for the erectophile varieties (r(2) 0.53 and 0.47 for cane tonnage and sugar yield, respectively); however, the model for planophile varieties weakened slightly. Results of this study indicate using an INSEY value for predicting sugarcane yield shows potential of being a valuable management tool for sugarcane producers in Louisiana.

Fernandes J L, Rocha J V, Lamparelli R A C.

Sugarcane yield estimates using time series analysis of spot vegetation images

[J]. Scientia Agricola, 2011, 68(2):139-146.

[本文引用: 1]

Rahman M M, Robson A.

Integrating Landsat-8 and sentinel-2 time series data for yield prediction of sugarcane crops at the block level

[J]. Remote Sensing, 2020, 12(8):1313.

[本文引用: 1]

张淮栋, 陈争光, 张成龙.

基于高分二号-NDVI的大豆遥感估产的时相选择

[J]. 湖北农业科学, 2018, 57(6):103-108.

[本文引用: 1]

Zhang H D, Chen Z G, Zhang C L.

Time selection of estimation yield with remote sensing of soybean based on GF-2-NDVI

[J]. Hubei Agricultural Sciences, 2018, 57(6):103-108.

[本文引用: 1]

朱再春, 陈联裙, 张锦水, .

基于信息扩散和关键期遥感数据的冬小麦估产模型

[J]. 农业工程学报, 2011, 27(2):187-193,398.

[本文引用: 1]

Zhu Z C, Chen L Q, Zhang J S, et al.

Winter wheat yield estimation model based on information diffusion and remote sensing data at major growth stages

[J]. Transactions of the Chinese Society of Agricultural Engineering, 2011, 27(2):187-193,398.

[本文引用: 1]

王恺宁, 王修信.

多植被指数组合的冬小麦遥感估产方法研究

[J]. 干旱区资源与环境, 2017, 31(7):44-49.

[本文引用: 1]

Wang K N, Wang X X.

Research on winter wheat yield estimation with the multiply remote sensing vegetation index combination

[J]. Journal of Arid Land Resources and Environment, 2017, 31(7):44-49.

[本文引用: 1]

娄正方, 李国清, 张向军, .

一种顾及多参数的冬小麦遥感估产方法与应用

[J]. 测绘通报, 2021(s1):154-158.

[本文引用: 1]

Lou Z F, Li G Q, Zhang X J, et al.

A method of winter wheat yield estimation by considering multiple parameters andits application

[J]. Bulletin of Surveying and Mapping, 2021(s1):154-158.

[本文引用: 1]

贾艳红, 苏筱茜, 李鹤冉.

1991—2020年南宁市气候变化特征分析

[J]. 广西师范大学学报(自然科学版), 2023, 41(2):190-200.

[本文引用: 1]

Jia Y H, Su X Q, Li H R.

Characteristic analysis of climate change in Nanning from 1991 to 2020

[J]. Journal of Guangxi Normal University (Natural Science Edition), 2023, 41(2):190-200.

[本文引用: 1]

Shelhamer E, Long J, Darrell T.

Fully convolutional networks for semantic segmentation

[C]// IEEE Transactions on Pattern Analysis and Machine Intelligence.IEEE, 2017:640-651.

[本文引用: 1]

Ronneberger O, Fischer P, Brox T.

U-net:Convolutional networks for biomedical image segmentation

[M]// Lecture Notes in Computer Science. Cham: Springer International Publishing, 2015:234-241.

[本文引用: 1]

Yu C, Gao C, Wang J, et al.

BiSeNet V2:Bilateral network with guided aggregation for real-time semantic segmentation

[J]. International Journal of Computer Vision, 2021, 129(11):3051-3068.

[本文引用: 1]

Wang Q, Wu B, Zhu P, et al.

ECA-net:Efficient channel attention for deep convolutional neural networks

[C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).Seattle,WA,USA.IEEE, 2020:11531-11539.

[本文引用: 1]

Badrinarayanan V, Kendall A, Cipolla R.

SegNet:A deep convolutional encoder-decoder architecture for image segmentation

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(12):2481-2495.

DOI:10.1109/TPAMI.2016.2644615      PMID:28060704      [本文引用: 1]

We present a novel and practical deep fully convolutional neural network architecture for semantic pixel-wise segmentation termed SegNet. This core trainable segmentation engine consists of an encoder network, a corresponding decoder network followed by a pixel-wise classification layer. The architecture of the encoder network is topologically identical to the 13 convolutional layers in the VGG16 network [1]. The role of the decoder network is to map the low resolution encoder feature maps to full input resolution feature maps for pixel-wise classification. The novelty of SegNet lies is in the manner in which the decoder upsamples its lower resolution input feature map(s). Specifically, the decoder uses pooling indices computed in the max-pooling step of the corresponding encoder to perform non-linear upsampling. This eliminates the need for learning to upsample. The upsampled maps are sparse and are then convolved with trainable filters to produce dense feature maps. We compare our proposed architecture with the widely adopted FCN [2] and also with the well known DeepLab-LargeFOV [3], DeconvNet [4] architectures. This comparison reveals the memory versus accuracy trade-off involved in achieving good segmentation performance. SegNet was primarily motivated by scene understanding applications. Hence, it is designed to be efficient both in terms of memory and computational time during inference. It is also significantly smaller in the number of trainable parameters than other competing architectures and can be trained end-to-end using stochastic gradient descent. We also performed a controlled benchmark of SegNet and other architectures on both road scenes and SUN RGB-D indoor scene segmentation tasks. These quantitative assessments show that SegNet provides good performance with competitive inference time and most efficient inference memory-wise as compared to other architectures. We also provide a Caffe implementation of SegNet and a web demo at http://mi.eng.cam.ac.uk/projects/segnet.

Chen L C, Zhu Y, Papandreou G, et al.

Encoder-decoder with atrous separable convolution for semantic image segmentation

[C]// European Conference on Computer Vision.Cham:Springer, 2018:833-851.

[本文引用: 1]

Poudel R P K, Liwicki S, Cipolla R. Fast-SCNN:Fast semantic segmentation network[EB/OL]. 2019:arXiv:1902.04502. https://arxiv.org/abs/1902.04502.pdf

URL     [本文引用: 1]

Yu C, Wang J, Peng C, et al.

BiSeNet:Bilateral segmentation network for real-time semantic segmentation

[C]// European Conference on Computer Vision.Cham:Springer, 2018:334-349.

[本文引用: 1]

Hosmer D W Jr, Lemeshow S, Sturdivant R X. Applied logistic regression[M]. Nev Hoboken: John Wiley and Sons Inc, 2013.

[本文引用: 1]

Pisner D A, Schnyer D M. Support vector machine[M]//Machine Learning. Amsterdam: Elsevier, 2020:101-121.

[本文引用: 1]

Priyanka N A, Kumar D.

Decision tree classifier:A detailed survey

[J]. International Journal of Information and Decision Sciences, 2020, 12(3):246.

[本文引用: 1]

Breiman L.

Random forests

[J]. Machine Learning, 2001, 45(1):5-32.

[本文引用: 1]

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发