基于深度学习的TRMM降水产品降尺度研究——以中国东北地区为例
南京信息工程大学遥感与测绘工程学院,南京 210044
Research on downscaling of TRMM precipitation products based on deep learning: Exemplified by northeast China
School of Remote Sensing and Geomatics Engineering, Nanjing University of Information Science and Technology, Nanjing 210044, China
通讯作者: 石玉立(1973-),男,博士,教授,主要从事降水、机器学习等研究。Email:ylshi@nuist.edu.cn。
责任编辑: 李 瑜
收稿日期: 2020-01-2 修回日期: 2020-03-15 网络出版日期: 2020-12-15
基金资助: |
|
Received: 2020-01-2 Revised: 2020-03-15 Online: 2020-12-15
作者简介 About authors
杜方洲(1996-),男,硕士研究生,主要从事遥感反演、3S集成等研究。Email:
降水的季节性时空分布研究对东北地区的生态保护和农业生产有重要意义。基于植被指数、地形因子与降水的相关性,采用深度学习模型,对2009—2018年10 a间平均1,4,7,10月TRMM_3B43产品降尺度至0.01°(约1 km),使用站点实测数据进行精度校正,并填补TRMM未覆盖的50°N以上地区。结果表明,该模型效果优于随机森林,可有效获得各季节较高空间分辨率与精度的研究区域降水分布,校正后全局决定系数R2介于0.881~0.952之间,均方根误差介于1.222~13.11 mm之间,平均相对误差介于7.425%~28.41%之间,其中4月和10月份拟合度较好,1月和7月份相对稍差。
关键词:
The research on the seasonal spatial and temporal distribution of precipitation is of great significance to the ecological protection and agricultural production in northeast China. Based on the correlation between vegetation index, topographical factors and precipitation, this paper utilizes deep learning models to downscale TRMM_3B43 products to 0.01° (about 1 km) in January, April, July, and October during 2009—2018, and uses site measured data to make accuracy correction and fill areas above 50 ° N which are not covered by TRMM. The results show that the model is better than random forest and can effectively obtain the precipitation distribution in the study area with higher spatial resolution and accuracy in each season. The corrected global determination coefficient R2 is between 0.881 and 0.952, the root mean square error (RMSE) is between 1.222 mm and 13.11 mm, and the mean relative error (MRE) is between 7.425% and 28.41%, among which the fitting degree is good in April and October, and relatively poor in January and July.
Keywords:
本文引用格式
杜方洲, 石玉立, 盛夏.
DU Fangzhou, SHI Yuli, SHENG Xia.
0 引言
热带降雨测量任务卫星(Tropical Rainfall Measurement Mission,TRMM)是由美国国家航空航天局和日本航空航天局联合研制的,旨在记录全球降水以进行气候研究,具有覆盖范围广、时效性好等优势[8,9]。然而在降水和地形复杂地区进行研究时,TRMM产品的空间分辨率(0.25°×0.25°)不能满足要求,需要对其进行降尺度以提升空间分辨率。目前国内外常用的TRMM降尺度方法是基于降水相关因子构建降尺度模型,蔡明勇等[10]以雅鲁藏布江为研究区域,构建复杂地形下的TRMM产品多元线性回归降尺度模型; Shi等[11]使用增强型植被指数(enhanced vegetation index,EVI)和其他地形因子构建青藏高原地区随机森林(random forest,RF)降尺度模型; 徐彬仁等[12]基于RF算法,构建TRMM产品与归一化植被指数(normalized difference vegetation index,NDVI)和地形因子的降尺度模型,最终得到青藏高原8 km分辨率降尺度降水结果; 刘小婵等[13]构建东北地区年尺度TRMM产品GWR降尺度模型,并与全局 OLS回归模型进行对比。随着计算机性能的不断突破和人工智能的兴起,深度学习(deep learning)在各研究领域得到广泛应用[14]。相比传统神经网络,深度学习拥有更多的神经网络层数,具备更强的学习能力和更有效的训练机制,模型的层次结构仅连接在相邻层神经元之间,同层和跨层神经元则不相互连接,因此可以模仿人脑高效、准确的表示信息[15]。目前,深度学习多应用于图像识别、计算机视觉等领域 [16],在遥感建模方面还鲜有应用。
综上所述,目前国内对TRMM产品的降尺度研究是以构建传统机器学习算法模型为主,鲜有使用深度学习构建模型,模型时间尺度大多为年尺度,缺少季节性降水研究,因TRMM卫星扫描范围的限制, 50°N以上地区没有卫星数据覆盖,因此这部分区域少有研究。本文以东北地区为研究区,基于植被指数和地理因子,以1,4,7,10月代表不同季节,构建TRMM产品深度学习降尺度模型,并与RF模型进行比较,而后以站点实测降水数据作为依据,计算模型在全局和TRMM未覆盖地区的精度,并校正模型预测结果,最终得到东北地区各季节降尺度降水分布。
1 研究区概况与数据源
1.1 研究区概况
研究区为中国东北地区,经度范围E97°~135°,纬度范围N37°~54°,行政边界包括黑龙江省、吉林省、辽宁省和内蒙古自治区东五盟(锡林郭勒盟、兴安盟、呼伦贝尔市、赤峰市、通辽市),不包括辽宁省周边岛屿,总面积约145万km2。地势起伏较大,海拔高度整体自西向东降低。地形复杂多变,主要地形包括高原、山地、丘陵、台地和平原。辽宁省地处欧亚大陆东岸,属于温带季风气候,四季分明,是东北地区降水最多的省份; 吉林省、黑龙江省和内蒙古自治区东五盟属于温带大陆性季风气候,其中大兴安岭北段地区属于寒温带大陆性季风气候,冬季长,夏季短,降水主要集中在夏季。
1.2 数据源
本文使用的研究资料包括: TRMM3B43_V7产品、MOD13A3 NDVI产品、数字高程模型(digital elevation model,DEM)、气象站点数据,所有数据地理范围为(E97°~135°,N37°~54°),时间跨度为2009—2018年,选取1,4,7和10月这4个月份分别代表冬、春、夏、秋4个季节,目的是研究降尺度模型的季节适用性。
TRMM3B43_V7降水产品下载于美国国家航空航天局降水测量计划网站(
图1
图1
研究区地形及气象站点分布
Fig.1
Topographic and meteorological station distribution in the study area
2 研究方法
降水是一个非常复杂的气象过程,与多个影响因子相互作用。要完成降水的降尺度工作,需要选择与降水尺度对应且相关性高的遥感因子作为输入自变量,构建与TRMM数据的降尺度模型,再对预测结果进行精度验证和校正。
2.1 模型构建
2.1.1 降尺度因子选择
根据以往的研究资料,研究区降水有十分明显的季节性和地域性,中部区域地势较平坦,植被分布相对密集,降水多; 西北部与南部区域地形复杂,植被稀疏,降水少,且总体来看,研究区降水呈东多西少、夏多冬少的规律。降水对植被生长有非常重要的影响,二者存在着显著的相关关系[17],因此选择NDVI作为构建模型的一个重要因子。同时,地形也是影响降水的重要因素,在植被稀疏的高海拔地区,地理位置对当地降水有着重要影响[18]。综上所述,本文以TRMM数据为因变量,选择NDVI、经度(LON)、纬度(LAT)、海拔(Altitude)、坡度(Slope)、坡向(Aspect)作为构建模型的自变量因子,构建以
1)数据预处理。将所有数据裁切至研究区范围,对DEM数据提取经纬度、海拔、坡度和坡向因子,对MOD13A3产品提取NDVI数据。所有自变量因子分别重采样至0.01°和0.25°分辨率。其中0.25°分辨率的自变量因子均裁去纬度50°以上区域,保证在空间尺度上与TRMM数据匹配。
2)选择0.25°分辨率的自变量因子与同时空环境下的TRMM数据输入深度学习算法,构建各月降尺度模型。得到模型后,将各月0.01°分辨率的自变量因子输入,得到各月份模型预测降尺度降水。
2.1.2 模型介绍
图2
2.1.3 模型训练过程
模型具体训练过程包括: ①自下而上的非监督学习。首先,使用无标定数据训练第一层,并学习第一层的参数,使生成的模型可以学习数据结构本身的特征,因此比输入数据具备更好的特征表达能力; 在学习达到第n-1层之后,将n-1层的输出作为第n层的输入,并训练第n层,从而获得各层的参数。②自上而下的监督学习。通过使用带标签的数据进行训练,误差自上到下传播,对网络结构进行微调,并调整各层之间的权重。
算法基于R语言中的h2o包实现,可在
2.2 精度验证
本文使用决定系数(R2)、均方根误差(root mean square error,RMSE)和平均相对误差(mean relative error,MRE)来对模型预测结果进行精度判定。决定系数
式中:
2.3 结果校正
本文使用气象站点实测数据验证TRMM降水与降尺度降水的精度并进行对比。将站点随机均匀分为校正站点和验证站点,计算校正站点数据与降尺度数据的差值,基于ArcGIS软件平台进行插值运算,得到覆盖研究区的面状差值图,对降尺度降水进行校正,再用验证站点验证校正精度,最终得到校正后的研究区各月降尺度降水。
文中使用的插值方法是反距离权重插值法(inverse distance weighted,IDW),原理是以插值点与样本点间的距离为权重进行加权平均,因此距离插值点越近的样本点被赋予的权重越大。
3 分析与讨论
3.1 模型参数调优
通过调整隐藏层层数
表1 模型参数调整结果
Tab.1
训练集 | 测试集 | |||||
---|---|---|---|---|---|---|
4 | 400 | 150 | 0.866 | 1.402 | 0.850 | 1.423 |
4 | 400 | 200 | 0.868 | 1.229 | 0.863 | 1.341 |
4 | 400 | 250 | 0.874 | 1.221 | 0.869 | 1.310 |
5 | 400 | 150 | 0.900 | 1.109 | 0.891 | 1.146 |
5 | 400 | 200 | 0.911 | 0.995 | 0.901 | 1.054 |
5 | 400 | 250 | 0.899 | 1.098 | 0.893 | 1.152 |
6 | 400 | 150 | 0.889 | 1.173 | 0.885 | 1.261 |
6 | 400 | 200 | 0.915 | 0.947 | 0.894 | 1.079 |
6 | 400 | 250 | 0.898 | 1.097 | 0.892 | 1.149 |
… | … | … | … | … | … | … |
结果表明,当测试集出现最大的
3.2 降尺度结果与精度检验
图3是降尺度前后研究区各月份降水空间分布对比,可以看出,降尺度后的图像空间分辨率相较原始TRMM图像有了明显的提升,降尺度前后空间分布一致性较高,对不同等级的降水量都有很好的还原效果。但空间分辨率提高不代表精度的提升,为进一步验证降尺度精度,本文使用研究区内站点实测数据对降尺度数据进行精度检验,计算降尺度前后评价指标
图3
图3
2009—2018年10 a平均1,4,7,10月0.25°×0.25°TRMM降水与0.01°×0.01°降尺度降水对比
Fig.3
Comparison of 0.25°×0.25° TRMM precipitation with 0.01°×0.01° downscale precipitation during 2009—2018
3.2.1 研究区全局结果精度验证
由图4可知,深度学习模型预测的降尺度降水量与实测降水量之间存在显著的线性相关关系,相比原始TRMM产品更接近实测降水量,说明深度学习降尺度模型有较高的拟合度。降尺度前后精度对比如表2所示,降尺度降水量的决定系数
图4
图4
各月份站点实测降水量分别与TRMM降水量和降尺度降水量的散点图
Fig.4
Scatter plots of the station’s measured precipitation with TRMM precipitation and downscale precipitation
表2 降尺度前后精度对比
Tab.2
月份 | ||||||
---|---|---|---|---|---|---|
降尺 度前 | 降尺 度后 | 降尺 度前 | 降尺 度后 | 降尺 度前 | 降尺 度后 | |
1月 | 0.798 | 0.826 | 2.819 | 2.503 | 79.76 | 71.31 |
4月 | 0.879 | 0.935 | 5.608 | 4.161 | 20.92 | 19.42 |
7月 | 0.784 | 0.817 | 20.960 | 16.870 | 12.37 | 11.08 |
10月 | 0.858 | 0.908 | 5.649 | 4.398 | 13.43 | 10.28 |
总体来看,深度学习降尺度模型不仅可以很大程度提高降水产品的空间分辨率,同时也降低了与实测降水量数据的误差,比TRMM降水产品精度更高。其中4月和10月降尺度效果较好,1月和7月效果相对稍差,原因是1月份部分地区以降雪为主[20],且分布极其不均匀,导致植被因子在模型中的贡献度较低,降水量与经纬度等地理因子相关性更高; 7月份实际降水情况复杂多变,多小尺度对流降雨,而TRMM产品分辨率相对较粗,不能很好地捕捉复杂降水变化,因而导致这2个月份模型模拟效果相对稍差。
3.2.2 TRMM未覆盖地区预测精度检验
本文从东北地区已有站点中筛选出50°N以上地区气象站点共8个,计算精度评价指标,结果如表3所示。1—10月间,决定系数
表3 TRMM未覆盖地区预测精度验证
Tab.3
月份 | |||
---|---|---|---|
1月 | 0.324 | 2.813 | 54.130 |
4月 | 0.556 | 3.331 | 19.220 |
7月 | 0.653 | 10.580 | 6.315 |
10月 | 0.800 | 2.251 | 29.730 |
因降水增多,模型拟合度相对较好,但由于站点数量的限制,精度较东北地区全局要低。
3.3 模型对比分析
前人在TRMM产品降尺度研究中,多用RF算法进行模型构建。为对比模型精度,本文同样使用RF算法进行降尺度模型构建,并与深度学习降尺度模型对比。 2种降尺度模型评价指标对比如表4所示,总体上来看,深度学习降尺度模型效果要好于RF模型效果。深度学习模型的决定系数
表4 基于RF与基于深度学习降尺度模型精度指标评价
Tab.4
月份 | ||||||
---|---|---|---|---|---|---|
RF | DFNN | RF | DFNN | RF | DFNN | |
1月 | 0.787 | 0.826 | 2.561 | 2.503 | 77.79 | 71.31 |
4月 | 0.893 | 0.935 | 5.438 | 4.161 | 20.26 | 19.42 |
7月 | 0.809 | 0.817 | 18.94 | 16.870 | 13.66 | 11.08 |
10月 | 0.892 | 0.908 | 4.935 | 4.398 | 11.99 | 10.28 |
3.4 降尺度结果校正
为提升精度,得到更加接近实测降水量的降尺度降水,需要基于地面实测降水量对模型预测的降尺度降水进行校正,本文从研究区内92个气象站点中随机均匀选取60%(约55个)用于校正,剩余40%用于验证校正效果,计算验证站点数据与校正前后降尺度数据的精度评价系数,结果如表5所示。
表5 各月降尺度结果校正前后精度指标
Tab.5
月份 | ||||||
---|---|---|---|---|---|---|
校正前 | 校正后 | 校正前 | 校正后 | 校正前 | 校正后 | |
1月 | 0.833 | 0.881 | 2.413 | 1.222 | 70.86 | 28.410 |
4月 | 0.939 | 0.952 | 4.297 | 3.508 | 20.41 | 9.473 |
7月 | 0.825 | 0.891 | 16.460 | 13.110 | 11.66 | 7.555 |
10月 | 0.924 | 0.932 | 4.474 | 3.301 | 10.34 | 7.425 |
图5
图5
站点校正后的1,4,7,10月0.01°×0.01°降尺度降水空间分布
Fig.5
Spatial distribution of precipitation downscaled by 0.01°×0.01° in Jan., Apr., Jul., and Oct. after station correction
整体来看,受东亚冬季风和西太平洋副热带高压的影响[21],研究区域各月份降水空间分布极其不均匀,其中夏季降水多,冬季降水少。降水量整体呈由西北方向往东南方向递增的变化趋势。
4 结论
本文研究东北地区季节性降水分布,基于降水和植被指数以及地理因子的相关性,使用TRMM_3B43月降水数据、MOD13A3 NDVI数据、DEM数据和气象站点数据,采用深度学习算法构建TRMM产品降尺度模型,将TRMM产品空间分辨率由0.25°(约26 km)提升至0.01°(约1 km),并填补TRMM卫星原始数据未覆盖的50°N以上地区,再以实测站点数据对降尺度结果进行精度分析与校正。主要结论如下:
1)基于深度学习的降尺度模型能够很好地完成TRMM产品的降尺度,有效提高了TRMM产品的空间分辨率和精度,模型适用性和估算精度优于随机森林模型,各月决定系数
2)模型预测精度有季节性差异,4月和10月模拟效果较好,1月和7月相对稍差。主要原因是研究区冬季降雪和降水时空分布不均导致植被指数与降水量的相关性较低,夏季多小范围对流降雨导致TRMM卫星捕捉降水能力变差。
此外,模型在TRMM未覆盖地区的季节性偏差仍较大,后续研究可以考虑加入其他相关因子,如地表温度、水汽等,以进一步提升模型预测效果。
参考文献
Trends of temperature and precipitation extremes in the Loess Plateau Region of China,1961—2010
[J].
Projected changes of precipitation extremes in river basins over China
[J].
Changing spring phenology dates in the three-rivers headwater region of the Tibetan Plateau during 1960—2013
[J].
Changing inland lakes responding to climate warming in Northeastern Tibetan Plateau
[J].
我国东北地区自然植被保护现状及保护优先区分析
[J].
Conservation status and priority conservation areas of natural vegetation in northeast China
[J].
近50年中国东北地区气候变化对农业的影响
[J].
Influence of climate change on agriculture in northeast China in recent 50 years
[J].
气候变化对农业生产的影响及其适应
[J].
Climate change affects crop production and its adaptation
[J].
基于SWAT模型的TRMM降水数据径流模拟适宜性评价
[J].
Evaluation of runoff simulation using TRMM precipitation data based on SWAT model
[J].
TRMM-3B43降水产品在新疆地区的适用性研究
[J].
DOI:10.6046/gtzyyg.2016.03.26
URL
[本文引用: 1]
为研究热带降雨测量计划卫星(tropical rainfall measuring mission,TRMM)-3 B43(简称"TRMM")降水产品在新疆地区的适用性,利用1998-2013年TRMM月降水量产品与新疆地区105个国家气象站点的降水观测结果,通过统计分析分别在年、季和月尺度上进行验证。结果表明:TRMM估算的年降水量与新疆地区实测降水具有很高的一致性(平均偏高5.29%);与气象站点实测的季尺度降水数据决策系数较高,相关系数均在0.7以上;与气象站点实测的月降水数据的相关系数为0.75,表明两者之间相关性较显著,数据精度较高。就单个气象站点而言,大部分TRMM降水数据与气象站点实测降水数据相关系数较高,误差在30%以内,整体相关系数达到0.81,说明TRMM降水数据与气象台站点实测降水数据的一致性较好;但TRMM降水产品在时间和空间上具有一定的偏差,使用中需要进一步订正。
Applicability research on TRMM-3B43 precipitation over Xinjiang
[J].
雅鲁藏布江流域TRMM降水数据降尺度研究
[J].
TRMM precipitation downscaling in the data scarce Yarlung Zangbo River Basin
[J].
Mapping annual precipitation across mainland China in the period 2001—2010 from TRMM3B43 product using spatial downscaling approach
[J].
基于随机森林算法对青藏高原TRMM降水数据进行空间统计降尺度研究
[J].
Spatial statistics of TRMM precipitation in the Tibetan Plateau using random forest algorithm
[J].
东北地区TRMM数据降尺度的GWR模型分析
[J].
Spatial downscaling of TRMM precipitation data based on GWR model in northeast China
[J].
Deep learning
[J].
DOI:10.1038/nature14539
URL
PMID:26017442
[本文引用: 1]
Deep learning allows computational models that are composed of multiple processing layers to learn representations of data with multiple levels of abstraction. These methods have dramatically improved the state-of-the-art in speech recognition, visual object recognition, object detection and many other domains such as drug discovery and genomics. Deep learning discovers intricate structure in large data sets by using the backpropagation algorithm to indicate how a machine should change its internal parameters that are used to compute the representation in each layer from the representation in the previous layer. Deep convolutional nets have brought about breakthroughs in processing images, video, speech and audio, whereas recurrent nets have shone light on sequential data such as text and speech.
Methods for interpreting and understanding deep neural networks
[J].
A fast learning algorithm for deep belief nets
[J].
Sensitivity of NDVI-based spatial downscaling technique of coarse precipitation to some mediterranean bioclimatic stages
[J].
A statistical spatial downscaling algorithm of TRMM precipitation based on NDVI and DEM in the Qaidam Basin of China
[J].
Upscaling of surface soil moisture using a deep learning model with VIIRS RDR
[J].
我国东北地区冬季降水和东亚冬季风的关系研究
[J].
The relationship between winter precipitation and eastern Asian winter monsoon in northeast China
[J].
1961—2013年东北地区夏季降水变化趋势分析
[J].
Analysis on the trend of variation of summer precipitation in northeast China during the period from 1961—2013
[J].
/
〈 |
|
〉 |
