李军, 董恒, 王祥, 游林

1.中国矿业大学(北京)地球科学与测绘工程学院,北京 100083

2.武汉理工大学资源与环境工程学院,武汉 430070

Reconstructing missing data in soil moisture content derived from remote sensing based on optimum interpolation

LI Jun,1, DONG Heng,2, WANG Xiang1, YOU Lin1

1.College of Geoscience and Surveying Engineering, China University of Mining and Technology(Beijing), Beijing 100083,China

2.School of Resources and Environmental Engineering, Wuhan University of Technology, Wuhan 430070,China

遥感反演土壤含水量是干旱遥感监测中必不可少的环节,但遥感传感器往往受到云雪或自身性能等因素影响而存在数据缺失。现有基于时间序列数据的滤波插补法对数据要求较高而难以推广,而空间插值方法在成块缺失区域效果较差。针对此问题,提出利用最优插值法,根据气象站点实测数据对插值点的贡献定权,进而实现缺失像元的插值与填充。选取宁夏回族自治区为实验区,应用植被条件反照率干旱指数(vegetation condition albdedo drought index,VCADI)反演多个时期的土壤含水量结果,结合分布在研究区的16个国家级气象台站观测数据,利用最优插值法对缺失数据进行插补,结果表明该方法对不同程度数据缺失都具有较好的效果。通过人工模拟具有成块缺失与不同缺失率的数据,对比反向距离加权插值、Kriging空间插值方法和本文方法的插补效果,验证了本文方法具有更高的插补精度。

关键词: 土壤含水量 ; 遥感反演 ; 最优插值 ; 缺失数据


Remote sensing-based soil moisture content inversion is an indispensable procedure in drought monitoring; however, the image acquisition process is often influenced by bad weather such as cloud cover and snowfall, or sensor performance defects, which causes missing data. The existing filtering interpolation methods based on time series images have a high requirement on input data and thus are difficult to be widely applied, while the spatial interpolation methods do not work well for the images with missing blocks. In view of the above problems, this paper proposes a missing data filling method based on optimum interpolation, which predicts and fills missing data with the ground observation data as a reference. The authors selected Ningxia as the study area and obtained the soil moisture content in multiple periods using the VCADI index, and conducted missing pixel interpolation using the proposed method with the ground observation data of 16 national meterological stations. Experimental results show that the proposed method performs well in all regions with different levels of missing data. The authors simulated the images with missing blocks and different levels of missing data, and compared the performances between the inverse distance weighted interpolation method, the Kriging interpolation method and the optimum interpolation method. Experimental results show that the method proposed by the authors can obtain more accurate interpolation results.

Keywords: soil moisture content ; remote sensing inversion ; optimum interpolation ; missing data

李军, 董恒, 王祥, 游林. 基于最优插值的土壤含水量遥感反演缺失数据插补. 国土资源遥感[J], 2018, 30(2): 45-52 doi:10.6046/gtzyyg.2018.02.06

LI Jun, DONG Heng, WANG Xiang, YOU Lin. Reconstructing missing data in soil moisture content derived from remote sensing based on optimum interpolation. REMOTE SENSING FOR LAND & RESOURCES[J], 2018, 30(2): 45-52 doi:10.6046/gtzyyg.2018.02.06

0 引言

近几十年来,在全球气候变化的背景下干旱频繁发生,其影响范围之广,持续时间之长,受灾程度之重都十分罕见。据统计,每年因旱灾造成的全球经济损失高达60~80亿美元,远远超过了其他灾害[1]。我国是一个农业旱灾频发的国家,1950—2008年间,平均每年受旱面积为2 157万hm2,成灾面积为956万hm2,因旱灾损失粮食为158万t。而且干旱灾害发生次数逐年增加,特别是近几年接连不断发生在西南地区、山东省和长江中下游地区的特大干旱,给农业生产和经济发展带来巨大损失[2,3]。目前,利用遥感技术加强旱情实时监测已成为一个迫切的需求[4]。学者们针对各类卫星遥感数据,通过获取各类地表理化性质[5,6,7,8,9]监测旱情状况及变化,其中土壤含水量是反映干旱的一个最重要也是最直接的指标。通过遥感反演土壤含水量是干旱遥感监测业务中必不可少的环节。



1 最优插值法



Zai= k=1nPk(Zobk-Zgk)+Zgi, (1)

式中Pk为第k个气象台站的权重因子。该公式表示每个格点的分析值 Zai是由格点的初始估计值 Zgi加上修订值而获得,修订值由格点周围各气象台站观测值 Zobk与初估值 Zgk的偏差加权求得。令 eobk, egk, eaiegi分别为测站观测值、测站初始值和格点分析值和格点初始值与真值之差,假设局地均匀各向同性,由式(1)可得

eai= k=1nPk( eobk- egk)+ egi。 (2)

再假设 eobkegk相互彼此独立,观测误差相关系数为< egk, egl>=δklεk2,其中 εk2k点的观测误差的方差,即

δkl= 1k=l0kl。 (3)

E=< eai, eai>,表示分析场的均方差; mkl=< egk, egl>,表示kl这2点之间初始值误差之间的相关系数。则由式(2)在同一目标格点上求多次的平方平均值后可得

E=mii-2 k=1nPkmik+ l=1nk=1nPkPl+ k=1nPk2εk2, (4)

式中miii点初始值的方差,可以认为是常数。将式(4)左右同时除以mii,并令E'=E/mii,μik=mik/mii,ηk= εk2/mii,则式(4)可变换为

E'=1-2 k=1nPkμik+ l=1nk=1nPkPlμik+ k=1nPk2ηk 。 (5)


l=1nPlμik+2 k=1nPkηk=2 k=1nμik (k=1,2,…,n) , (6)


E'=1- k=1nPkμik (k=1, 2, …, n) 。 (7)



μkl=exp(-rkl/a) 。 (8)

式中a为常数系数,其取值越大,相关系数趋于0的距离(最大影响距离)也越大,此时对于密集的近处测站,它们的相关系数值相差很小,就不能很好反映出相关系数随距离变化的特性,最优权重系数也近似相等,将失去求相关的意义,故a的取值要根据各个测站的实际分布情况而定。本文研究实例中a取1 500 km。

2 研究方法

2.1 缺失像元识别


DI=f(X1,X2,…,Xn) , (9)


1)对于每个变量Xi,生成一幅标记有效值区域的掩模影像MaskXi。对于第k个像素,若像素值Xi,k∈[ LXi, UXi],则MaskXi,k=1,否则MaskXi,k=0,式中 LXiUXi分别为变量Xi的最小可能取值与最大可能取值。


Maskk=MaskX1,kMaskX2,kMaskXn,k。 (10)


DIfinalk=DIk Maskk+bgValue (1-Maskk) , (11)

式中: DIk为第k个像素处直接计算而得的干旱指数值; DIfinalk为最终的干旱指数值; bgValue为干旱指数的缺失像元填充值(如-999)。此时得到的干旱指数结果中,数值为bgValue的像元即为缺失像元。

2.2 缺失数据插补



ci= k=1nPk,ick, (12)

Pk,i= 1Dk,i2/k=1n1Dk,i2, (13)

式中: Pk,i为二阶反距离权重; Dk,i为第k个站点离像元i的距离。

2)缺失数据的填充。土壤含水量产品常以等时间间隔或较密集时相生产,但气象站点的实测数据可能缺少部分时期的数据。因此,在完成初始背景场的构建后,需根据不同时相的气象站点实测数据的完整性确定站点观测值的选择策略。气象站点处的土壤含水量值包含实测土壤水分值和遥感反演土壤水分值2类。本文采用如下选择策略,反演某时相的产品时,当具有实测土壤水分值的站点数量达到阈值(本文取8)时,则以实测土壤水分值作为观测值 Zob; 当上述条件不满足,而具有遥感反演土壤水分值的站点数量达到阈值时,则以遥感反演土壤水分值作为观测值 Zob; 若以上条件均不满足,则以初始背景场填充缺失数据。


3 研究实例

3.1 研究区及数据源概况

本文以中国西北的宁夏回族自治区为实验区(如图1所示),使用该区域内的MODIS地表反射率产品(MOD09A1)和反照率产品(MCD43B3),由美国NASA的EOS数据中心(https://wist.echo.nasa.gov/wist-bin/api/ims.cgi)下载,数据产品的时相为2001年3—9月间,是宁夏地区主要农作物的生长季节。使用前将原始数据转换为UTM投影,由红光波段与近红外波段计算归一化植被指数(normalized difference vegetation index,NDVI),构建基于NDVI-Albedo特征空间的植被条件反射率干旱指数(vegetation condition albedo drought index,VCADI )[33]作为干旱遥感反演指数。此外,搜集实验区内16个国家级气象台站(图1)同时期的土壤水分自动监测数据。通过选取同时具有地面实测土壤体积含水量与遥感VCADI指数的样本,采用回归分析构建基于VCADI的土壤体积含水量反演模型,进而反演各时相土壤含水量。


图1   研究区及气象观测站点

Fig.1   Study area and meterological observation stations

3.2 缺失数据插补效果分析



图2   2001年宁夏土壤体积含水量插补前(左)与插补后(右)对比

Fig.2   Soil moisture content of Ningxia in 2001 before (left) and after (right) interpolation process


1)对于像元缺失相对较少的时相,如97,113和153,插补整体效果较好,插补值与周围的旱情具有很好的空间连续性; 在时相113和153产品上,缺失数据既覆盖了高值区域,又覆盖了低值区域,插补后的数据仍然较好地反映了缺失区域的土壤体积含水量差异。



3.3 精度分析



图3   最优插值与其他插值方法对比

Fig.3   Comparison between results of optimum interpolation and other interpolation methods

以土壤含水量原始数据为参照,计算3种插值方法用于各期数据的均方根误差的平均值。对于反向距离加权插值法,东、南、西、北矩形框缺失数据插补结果的均方根误差分别为0.036 1,0.039 2,0.088 1和0.079 8; 对于Kriging插值法,4块区域的均方根误差分别为0.036 9,0.034 8,0.074 4和0.108 8; 对于最优插值法,4块区域的均方根误差分别为0.031 4,0.032 7,0.054 9和0.057 8。可以看出,Kriging插值法在空间异质性较高的数据区域出现缺失时插补效果不如反向距离加权插值法,而在异质性低的区域效果较好,二者效果总体相当。与这2种方法相比,最优插值法得到的插补结果精度更高,虽然插补结果与实际数值仍然有一定偏差,但在成片数据缺失且不依赖长时序序列数据的情况下,能基本反映出数据缺失区域的整体状况。



图4   不同缺失率数据模拟

Fig.4   Simulation of missing data at different levels

与原始数据进行对比,以均方根误差评价插补精度。当缺失率为10%时,插补误差为0.014 7; 当缺失率为20%时,插补误差为0.031 5; 当缺失率为30%时,插补误差为0.044 1; 当缺失率为40%时,插补误差为0.073 2。可以看出,在缺失比例很高时,插补结果仍然能达到较高精度,主要原因是模拟缺失数据是随机和均匀分布的,更利于依据周围数据插补真实结果。

4 结论





