第一作者: 王 玉(1988-),女,博士生,主要研究方向为土地利用与资源遥感。Email:wangyu881220@sina.com。
棉花与果树间作在新疆多地区普遍存在,了解套种情况有利于查明果棉产量以及与常规棉田产量结构差异。为此,提出了一种综合使用多源高分遥感数据的果棉间作信息提取方法。首先,在优化分割尺度基础上分析QuickBird卫星数据的光谱、形状和纹理特征并建立规则集; 其次,使用面向对象的分类方法逐步剔除非农田信息形成地块专题图,基于专题图选择最佳纹理特征提取果树分布并以地块为单位统计套种比例; 最后,依据棉花物候特征对高分一号数据多时相分类得到棉花种植信息,结合套种比例结果,统计果棉套种面积及程度。精度检验结果表明: 该文提出的方法与传统抽样调查法相比能够为大量地块信息的采集节省人工成本和时间,果棉信息提取精度为89.16%,可以在统计调查工作中用于新疆果棉套种的自动化提取。
The intercropping system of tree-cotton is widespread in Xinjiang because it may increase yield and revenue especially during the early years of tree plantations. The statistics of the intercropped area is a key element for yield estimation. A method which can extract the tree-cotton intercropped ratio from planting area themetic map is proposed in this paper. The VHR (very high resolution) QuickBird imagery and multispectral high spatial resolution (GF-1) data were combined for extracting the intercropped ratio using the object-oriented approach and multi-seasonal classification approach respectively. Farmland extraction is a critical step to produce the intercropped information. Since multi-resolution segmentation (MRS) has been proved to be one of the most successful image segmentation algorithms, the trial-and-error process has been used to determine the three main optimal segmentation parameters (scale, shape, compactness) to identify farmland and tree canopy hierarchically. The new rule sets which consider optimal,shape and semantic features have been implemented to compile the farmland thematic map. Then, the GLCM-based texture feature has been proposed to distinguish the tree canopy when the image is segmented again. Intercropping ratio in each crop segmentation unit is calculated by stacking the farmland themetic layer and the tree canopy layer together. Since then, multi-seasonal classification approach has been used to extract the tree-cotton intercropping ratio from the intercropping ratio map. In addition, this work presents two varying images composed of GF-1 and Landsat8. By analyzing the phenologycal calendar, optimum temporal periods for cotton and other major crops are initially determined. Cotton planting areas are extracted by field samples supported supervised classification. The GF-1 accuracy achieves 89.16% which is by far better than TM results. Finally, tree-cotton interplanting area and ratio are extracted based on tree-crop intercropping map and cotton planting map.
新疆维吾尔自治区果棉间作立体种植模式既保护了棉花在当地的产业优势, 又能兼顾农民增收和防风固沙的社会、生态效益[1]。近几年, 随着新疆环塔里木林果业的发展, 果棉间作种植模式迅速扩大, 已成为新疆绿洲农业重要的新型种植模式[2, 3]。国内外学者往往更关注于间作模式[4, 5]高效增产的种植技术问题[6, 7], 而针对果棉间作空间分布提取的研究较为少见。南疆环塔里木盆地果棉间作种植规模不断扩大, 了解该地区套种分布及比例既有助于查明果棉套种产量、了解与常规棉田相比产量结构差异, 也有助于棉花遥感测产结果的准确获取, 为精准农业测产和农业产业结构调整政策提供依据。
随着具有丰富空间结构和纹理信息的高空间分辨率遥感影像的不断出现, 面向对象的分类方法与传统面向像元的分类方法相比精度明显提高, 应用也日趋广泛。农业遥感应用方面, 农田地块、灌溉系统[8]等典型地类的自动化识别是当前研究的热点。准确的农田地块信息是套种提取的基础。国内外许多学者利用面向对象的分类方法或数学形态学方法[9]对农田边界提取研究进行了初探。张锦水、陈杰、朱超洪等[10, 11, 12, 13]充分挖掘目标地物的光谱特征、纹理特征、形状特征及语义特征实现了包括农田在内的多种地类信息的提取; Esch使用高分与多时相数据, 采用决策树分类提取基于像元的主要农作物及草地的分布信息[14]。国内外研究结果表明, 虽然针对地块中果棉套种程度识别的研究尚无先例, 但在合理选择高分与多时相遥感数据的基础上能够实现农田及内部典型地物的提取。
本文综合使用多源高分数据, 采用多时相分类与面向对象分类相结合的方法提取区域果棉套种信息, 并对套种程度及分布规律进行了分析。
2009年以来, 新疆喀什的棉花种植面积一直在增加, 近几年该地区棉花种植面积约占全区耕地总面积的40%。为提高农民收入, 当地政府鼓励农民实行红枣套种棉花的种植结构, 并已取得了良好的经济和社会效益。本文选择位于喀什中部莎车县的4 km× 4 km大小正方形区域作为研究区(图1), 研究区内果棉间作情况普遍, 具有区域代表性。
本文使用的遥感数据主要为QuickBird数据和国产高分一号(GF-1)卫星数据。
1)QuickBird数据获取时间为2014年10月3日。该时期农普物候历显示主要农作物NDVI值均较高, 便于提取地块与果树信息。实验前先运用Pan-sharp变换[15, 16]将空间分辨率分别为2.44 m和0.61 m的多光谱数据与全色数据进行融合。融合后的数据有利于影像判读和光谱、形状、纹理特征规则集的构建。
2)GF-1数据获取时间分别为2014年5月、8月和9月。本文使用了空间分辨率8 m多光谱影像以及2 m全色波段影像, 首先在ENVI平台下分别对2种分辨率影像进行正射校正, 采用Gram-Schmidt 数据融合方法将多光谱与全色数据进行融合, 用以提取棉花种植信息, 并与QuickBird数据几何配准。为满足面积统计的准确性, 本文所用遥感数据源均调整为WGS-84坐标系、Albers双标准纬线圆锥等积投影以控制投影带来的面积形变。
此外, 本文还使用了2014年喀什地区65个野外调查地块数据, 该数据分布在3个300 m× 300 m格网中, 为目视判读及目标信息提取提供了训练样本。
如何分割与分类是面向对象的分类技术需要解决的关键问题[17]。本文在优化分割尺度基础上, 通过分析光谱、形状、纹理、语义等特征, 逐步剔除非目标对象得到农田地块专题图, 经2次分割分类得到地块内果树分布, 统计获得各地块套种比例。图2为果棉套种信息提取的总体技术流程。
多尺度分割算法已经被证实是最成功的面向对象分类分割算法之一。由于传统人机交互反复实验法寻找最优分割尺度费时费力, Liu等[18]提出了欧氏距离指标ED2用以自动提取最优分割尺度, 该方法在小尺度测试结果较为理想, 对大尺度分割并不敏感。Witharana等[19]通过模拟不同分割参数对分类的影响后指出, 尽管传统的人机交互实验法可能需要耗费大量时间和人力, 但仍是判定最优分割参数最直接有效的方法。
将QuickBird影像数据导入eCognition平台分割, 目标对象为自然地块, 通过对比21种不同参数设置下的分割结果与理想分割尺度的相似性, 依次确定尺度、形状因子和紧致度因子为最优参数。结果表明, 在尺度因子220、形状权重0.7、紧致度权重0.6条件下, 分割单元内部纹理均匀, 而且与相邻地块有明显独立的纹理特征, 故用以作为地块最优分割参数。同理, 得到果树提取最优参数(表1)。
2.2.1 农田地块专题图生成
在等级1分割尺度下, 道路、村落、道旁林地对农田提取精度有较大影响。因此, 本文通过分析目标对象与其他地物的光谱特征、形状特征、纹理特征和语义特征信息, 明确特征信息与地物之间的对应关系, 建立规则集(表2), 采用逐步剔除非目标地类的方法获得有种植结构的农田地块专题图。首先, 利用归一化植被指数(normalized difference vegetable index, NDVI)将QuickBird影像分为植被和非植被。植被可细分为农田和林地; 非植被可细分为道路和其他地类, 其他地类包括居民住宅、沙漠、无植被覆盖农田等。
村落周边的林地、道路信息在植被或非植被地类中均有分布。根据林地与农田的光谱亮度差异, 设置亮度(Brightness)阈值为260剔除林地信息; 选择密度(Density)值为1.3与长宽比(Width/Lenth)值为5, 共同构成道路提取条件。由于农田面积较大, 将小于2 500 像元的小图斑移除, 最终得到农田地块专题图(图3)。
2.2.2 农田地块中的果树信息提取
在农田地块图层内执行多尺度分割, 确定最优分割参数(表1中等级2)。农田地块间由于套种程度差异呈现不同的纹理结构, 故本文依据纹理特征提取树冠对象。
常见纹理特征灰度共生矩阵(grey level co-occurrence matrix, GLCM)包括对比度、能量(角二矩阵)、均一性、熵、相关性、均值、方差、相异性(Dissimilarity)8个纹理特征[19]。其中, 对比度为表征纹理清晰程度、纹理强弱的特征值; 能量(角二矩阵)在灰度分布均匀程度和纹理粗细方面有很好的表达; 均一性(逆差距)可以将纹理的规则程度分为不同等级; 熵值可用来表征纹理的复杂程度和图像信息量; 相关性是纹理在行或者列方向上的相似程度、灰度线性关系的度量; 均值特征值由平均灰度值计算而得, 反映整体色调的明暗深浅; 方差显示纹理变化快慢周期性大小; 相异性(Dissimilarity)则可以很好地区分纹理清晰程度不同的地块。在eCognition平台中计算8个纹理特征值加载至原QuickBird影像, 结果显示: 相异性(Dissimilarity)特征值是大型乔木的最佳指标, 而均值特征值可以识别地块果树尺度的树冠, 设置GLCM均值≤ 3作为果树提取的阈值。针对提取结果, 由于果树树冠对象面积较小, 设置面积特征值(Area)< 100像元可将纹理相似的草地信息剔除。
物候特征是区分不同作物的重要依据[21]。因此, 通过分析南疆农业普查数据中的棉花物候特征, 选择多时相提取的方法对GF-1数据采用最大似然法进行监督分类。
新疆地域宽广, 南疆与北疆农作物生育期差别较大, 总体而言, 北疆棉花生育期比南疆晚10~30 d左右。数据显示, 南疆棉花4月上旬开始陆续播种, 4月下旬出苗, 5月上旬至中旬为苗期, 5月下旬至6月上旬为蕾期, 6月下旬开花, 7月上旬进入开花盛期, 8月中下旬进入花铃期, 9月上旬吐絮期, 约10月上旬停止生长, 数据与相关研究物候描述保持一致[22, 23]。本文GF-1数据的获取时间(5月、8月、9月)都是区分棉花与菜地、棉花与玉米的关键期。在ENVI软件环境下计算3个时相NDVI值并叠加, 使用农田地块专题图层掩模后的NDVI叠加图层作为棉花提取基础数据。
选择棉花、菜地、春玉米等10种地类的野外样本纯像元用作监督分类的训练样本。样本的可分性结果显示, 棉花与其他9种地类的可分指数均大于1.8, 可以进行最大似然监督分类。
农田地块的提取结果中, 除道路、住宅、各种林地信息被完全剔除外, 地表土壤裸露的地块也得到过滤。专题图中仅保留了有作物种植状态的地块3 144个, 面积6.05 km2, 占总研究区总面积的37.5%, 由于分割参数的优化, 地块单元内部纹理均匀, 而且与相邻地块有明显独立的纹理特征。通过将地块专题图与人工矢量化格网叠加(图4)可知, 专题图边界与人工矢量化边界虽存在不够平滑锯齿状地块边界, 但总体吻合度高, 对不同作物地块均有较明确细致的划分, 使用该方法提取有作物农田地块克服了传统的手动屏幕数字化地块边界耗费大量人力和时间成本的缺点。
提取的农田斑块整体连通性较高, 斑块形状和面积变异较低, 形状较为规则, 规模大小变化不剧烈。道路与沟渠等廊道景观在空间分布上较为均匀, 居民点布局较为集中。
根据地块与树冠2个类别的语义关系计算果树在地块中的面积比例, 得到果树和其他作物(包括棉花、大豆、玉米等等)的地块套种比例专题图, 简称果树套种专题图。统计每个地块中果树种植面积比例属性可知, 果树面积比例在5%以下的地块没有果树或者仅有零星果树分布, 为非套种结构地块; 果树面积比例大于25%地块为错分的小面积林地等其他地类, 不属于套种地类。因此, 依据套种比例属性[0, 5%)(非套种地块), [5%, 10%), [10%, 15%), [15%, 20%), [20%, 25%]进行分类。由于果树套种专题图中不仅包含了棉花套种情况, 还包括了蔬菜、玉米等其他套种情况, 需要使用多时相法提取棉花种植信息并对果树套种专题图进行叠加过滤, 用以剔除非棉花套种面积。
使用多时相分类法对GF-1数据以及同时相TM数据分别进行棉花种植信息提取。研究区内主要作物有棉花、春玉米、夏玉米、菜地、西瓜等。菜地、西瓜以及道路等信息在地块专题图构建中由于地表土壤裸露程度较高, NDVI值较低已被剔除。由于8 m空间分辨率的 GF-1数据比25 m空间分辨率的TM更具优势, GF-1棉花样本3季度NDVI曲线与TM数据相比, 一致性更强。样本光谱一致性分析结果显示, 各种典型作物可分性较好。对比2种数据棉花信息提取结果(图5)显示: GF-1数
据棉花提取结果为3.34 km2, 椒盐现象不明显, 棉花地块整体度较高, 与野外样本中的作物种类及边界匹配更准确; TM数据提取的棉花整体分布与GF-1数据一致, 但提取面积大大减少, 仅为1.06 m2, 与野外样本匹配较差。
结合QuickBird数据的套种比例结果和GF-1棉花地块结果, 获得果棉套种比例及分布(图6)。
对不同套种比例下棉花套种面积进行统计, 结果见表3。
将果树与农作物套种面积比例为[0%, 5%)的地块定义为简单种植结构(非套种)地块, 研究区内简单种植结构地块面积共计3.01 km2, 其中果-棉套种地块个数为1 615个, 面积2.03 km2。表3数据显示: 各类果树套种面积为3.04 km2, 约占总农田面积6.05 km2的50%; 棉花与果树套种面积为1.16 km2, 约占总农田地块面积的19.17%, 约占果树总套种面积的38.16%。数据说明, 研究区内套种种植结构面积与简单种植结构面积比约为1: 1。在套种地块中, 约有38.20%的套种地块为果树棉花套种地块。54.31%果棉套种地块为[5%, 10%)的小套种比例地块, 仅有12.07%地块为大比例果棉套种[20%, 25%)地块。约50%的农民在选择果棉套种模式时, 对小比例果棉套种[5%, 10%)的种植结构更为青睐。研究区的中部以及东北部棉花分布聚集程度高, 套种情况也更加普遍。
为了客观评价不同中等空间分辨率数据多时相分类法的分类精度, 参考相关文献、现有野外样本地块作物属性资料, 以及高分遥感数据目视解译结果, 统计得到分类精度, 如表4所示。可以看出, TM数据的分类结果存在大量混合像元, GF-1数据识别总体精度达到89.16%, 高于TM数据识别的总体精度。对比不同作物的分类结果可知, 夏玉米与棉花由于NDVI值变化方向一致易形成错分。本研究表明, 使用多时相分类方法进行精细作物识别时, 既要考虑获取物候信息的时间分辨率, 又要兼顾获取地块信息的空间分辨率, GF-1数据与TM数据相比优势显著, 对不同作物种类识别的总体精度达到90%左右。本文中TM数据提取棉花信息结果受野外样本量较少的影响, 精度仅为64%, 结合郝鹏宇等[23]的研究结果证实, 使用野外样本充足的时序曲线匹配法对TM棉花的提取精度亦可达到89%。使用面向对象的多层多尺度分类法提取农田地块信息总体精度达到90.24%, 其中小面积林地为主要误差来源。
本文以新疆喀什中部莎车县地区作为研究区提取果棉套种信息。首先基于QuickBird数据, 使用面向对象的分类方法创建农田地块专题图, 然后在专题图层上选择最佳纹理特征提取果树分布及各种地类套种比例, 结合GF-1数据多时相棉花分类结果, 统计得到果棉不同套种比例面积及分布, 并进行了精度检验。结果表明:
1)使用面向对象分类方法创建农田地块专题矢量图与手动屏幕数字化相比, 耗费时间少, 操作过程不需人工干预, 稳定性高; 地块提取结果虽存在不够平滑的锯齿状边界, 但与人工矢量化格网总体吻合度高, 精度达到90.24%, 可以为地块单元的相关统计、研究提供参考。
2)使用GF-1数据提取的棉花种植面积约为3.34 km2, 总体精度为89.16%; 果棉套种面积约为1.16 km2, 其中小比例[5%, 10%)果棉套种面积0.63 km2, 占果棉全部套种的54.3%。结果说明, 研究区约一半以上的农民对果棉套种的种植模式认可并采用, 而小比例的套种结构更受到这部分农民的青睐。
3)使用多时相数据进行作物提取, GF-1数据时空分辨率较高, 比TM更具优势, 对野外样本需求量较低。
随着农业产业结构的不断优化, 不同区域果棉套种普及程度各有差异, 本文为新疆套种程度的动态监测提供了方法依据。另外, 中等空间分辨率TM数据的作物光谱受不同果棉套种程度影响有所差异, 探明TM光谱对套种比例的响应规律是下一步研究的重点。
The authors have declared that no competing interests exist.