基于LSTM-CA模型的土地利用动态模拟
Dynamic simulation of land use based on the LSTM-CA model
通讯作者: 夏建新(1963-),男,博士生导师,主要从事环境水力学和环境地学研究。Email:jxxia@vip.sina.com。
收稿日期: 2021-11-5 修回日期: 2022-05-13
Received: 2021-11-5 Revised: 2022-05-13
作者简介 About authors
刘春霖(1989-),男,博士研究生,主要从事遥感在生态环境保护方面的研究和应用。Email:
及时准确获取土地利用空间格局演变规律,能够有效为城市生态环境保护和科学管理提供依据。文章利用卷积神经网络提取多个时期土地利用空间特征,结合多种空间驱动因子建立长短时记忆网络(long short term memory network,LSTM)的元胞自动机(cellular automata,CA)模型(LSTM-CA)。以张家口市中心城区1995年、2000年、2005年、2010年及2015年5期时序土地利用分类、地形及城市交通等数据为基础,开展2020年城市土地利用模拟方法研究。通过与多层感知机(multi-layer perceptron,MLP)的CA模型(MLP-CA)进行精度对比分析,结果表明所提方法Kappa系数达到0.90,FoM指标为0.39,各项指标均优于MLP-CA模型, LSTM-CA更能充分挖掘历史土地利用变化之间的内在关系,可以有效提升模拟精度。
关键词:
Timely and accurate acquisition of the spatial pattern evolution of land use can effectively support urban ecological environment protection and scientific management. In this study, the spatial characteristics of land use in multiple periods were extracted using a convolutional neural network. Then, they were combined with multiple spatial driving factors to build the long short-term memory network - cellular automata (LSTM-CA) model. Based on the data of land use classification, terrain, and urban traffic of the Zhangjiakou central urban area in 1995, 2000, 2005, 2010, and 2015, this study investigated the simulation methods for urban land use in 2020. By comparison with the precision of the multi-layer perceptron - cellular automata (MLP-CA) model, the proposed method has a Kappa coefficient of over 0.90 and FoM of 0.39. All indices are better than those of the MLP-CA model. Therefore, the LSTM-CA model can fully explore the internal relationships between the changes in historical land use and effectively improve the simulation precision.
Keywords:
本文引用格式
刘春霖, 夏建新.
LIU Chunlin, XIA Jianxin.
0 引言
随着城市化进程的快速发展,人类对土地资源大力开发利用,导致区域范围内地表覆被时空格局发生巨大变化,不但改变了城市地表景观结构,而且影响陆地生态系统的物质循环、能量流动及其稳定性。因此,为了实现区域生态环境的科学保护,必须对城市土地变化规律有充分的认识和研究。
近年来元胞自动机模型(cellular automata, CA)在时空动态模拟领域受到广泛关注,CA提供了时空动态模拟运算框架,利用自下而上的模拟方式,由局部规则演化出全局的变化模式,实现了受宏观地理条件和土地利用局部变化双重作用下的土地利用变化模拟[1⇓⇓⇓⇓⇓-7]。Von Neumann[8]首次将CA定义为一个离散的动力学模型,由个体之间局部的行为演化出时间与空间上全局的变化模式。CA模型可与统计学方法和人工智能方法结合,实现更加精确、智能的复合模型。土地利用覆被变化过程是一个复杂的非线性变化过程,有学者指出需要建立转换规则自动获取方法应对复杂的土地利用变化过程。他们对利用统计学理论自动提取元胞转换规则的研究取得了突破性进展,例如多层感知机(multi-layer perceptron, MLP)、支持向量机 (support vector machine, SVM)和随机森林(random forest, RF)模型[9-10]。
在深度学习模型中递归神经网络用于建立时间序列数据之间的依赖性,它可以在时间步长之间传递历史信息,但普通的循环神经网络(recurrent neural network, RNN)在实际应用中很难处理长距离的依赖。长短时记忆网络(long short term memory network, LSTM)成功解决了原始RNN的问题,能够对具有长时间依赖性的时间序列进行建模,能够充分考虑历史时序土地分类的时间变化特征,被广泛应用于土地覆盖分类中[15-16]。因此,本文以张家口市中心城区(包括桥东区、桥西区及万全区)为研究对象,将1995年、2000年、2005年、2010年、2015年历史土地利用数据作为基础数据,提出将LSTM和CA模型结合来模拟2020年土地利用的动态变化,最后将模拟结果与实际2020年土地利用分布结果比较,证明本文提出的LSTM-CA模型能够有效提高土地利用变化模拟准确性。
1 研究区概况及数据处理
近年来随着城市化的不断发展,张家口市中心城区(桥东区、桥西区及万全区)面积迅速扩张,该区域土地类型变化明显,因此本文以张家口市中心城区为主要研究区,如图1所示,该区域位于N40.645°~41.059°,E114.440°~114.996°之间,其中桥东区及桥西区以清水河为界,研究区域主要是山地与河谷地,其海拔范围为800~1 500 m。
图1
本文以1995年、2000年、2005年、2010年、2015年、2020年Landsat5/8遥感数据为基础,参考《城市用地分类与规划建设用地标准》,通过卷积神经网络将研究区划分为耕地、建设用地、水体、林地、草地5类土地利用类型,根据研究实测调研数据进行精度检验,总体分类精度达90%以上。
土地利用变化的概率往往取决于一系列的距离变量和单元的自然属性等。例如,某一模拟单元越接近市中心及交通要道,其转变为城市用地的概率越高。由于研究区所在区域主要是山地与河谷地,土地利用分布受地形影响显著,因此河流水系是影响该城市土地分布的主要因素之一。与此同时,随着城市化的不断发展,其土地利用变化与城市交通紧密相连,土地利用变化受人类活动影响显著,对于地势相对平缓的区域,人类活动相对频繁,城市交通分布更加复杂,因此,本文在选择驱动因子时主要考虑城市水系、地形及交通等指标,其中地形因素包括高程、坡度、坡向等信息,对于交通因素主要选取市中心点、高速公路、火车站、城市主干道、城镇点、村庄点等要素,越是靠近城市中心,交通分布就越复杂,因此,利用ArcGIS软件距离分析工具,计算研究区内每一点到城市交通要素的最近欧式距离,以此作为土地利用变化另一空间指标,并对这些空间变量进行归一化处理,结果如图2所示。除此以外,邻近现有土地利用类型的数量对于土地利用变化也有一定的影响,例如当邻近范围内存在同一种土地类型越多,该单元在下一时刻不变的概率就较高,在本文中将与当前土地利用单元状态相同的邻域单元数量加入空间变量中。
图2
2 研究方法
将LSTM网络、CA和地理信息系统(geographic information system,GIS)相结合进行土地利用动态模拟,流程如图3所示,图中
图3
2.1 基于LSTM网络的土地利用发展概率计算
LSTM(图4)作为一种特殊RNN,可以解决长时间序列数据在训练中的梯度爆炸和消失问题。对于普通的RNN,权重在各个时间上是共享的,由于梯度被近时间梯度主导,导致模型难以学到远距离的依赖关系。对于LSTM网络,由于总的远距离梯度等于各条路径的远距离梯度之和,因此,LSTM能够在更长时间序列数据中具有更好的表现。RNN通常由一系列循环单元组成,相对于普通RNN,LSTM在循环单元的基础上增加了门限限制,这样可以使得信息进行有效过滤,在LSTM中每一个单元都有输入门、输出门和遗忘门3部分组成,其结构如图4所示。图中
图4
遗忘门限控制当前单元状态中丢弃的信息,利用当前时间的输入和前一个时间的输出来通过sigmoid函数来使得单元状态乘以这个sigmoid函数的输出。若sigmoid函数输出0则该部分信息需要被丢弃或遗忘,反之该部分信息继续在单元状态中继续传播。输入门限层是控制更新旧的单元状态。之前的遗忘门限中sigmoid 层决定哪些信息需要更新,通过 tanh 激活函数计算用来更新的内容,把这2部分联合起来,对单元状态进行更新。输出门限是对单元状态的限制,从而决定输出的信息。假设
式中:
在本文中,LSTM采用了历史土地利用分类及驱动因子作为输入向量,
2.2 基于LSTM-CA模型的土地利用模拟
LSTM计算的发展概率只考虑各种空间变量对土地转化的影响,在CA中邻域元胞状态对土地转化同样至关重要,例如邻域元胞有较多转变为建设用地,则该元胞转化为建设用地的概率也越大。因此,本文选择3
式中:
土地利用转换的过程中受到自然因素、人类活动等影响,使土地利用变化过程更加复杂。为了使模型结果更加符合实际情况,反映土地变化的不确定性,因此CA中引入随机扰动因子R[17],其表达公式为:
式中:
表1 土地利用各类型转换成本
Tab.1
土地利用类型 | 转换后状态 | |||||
---|---|---|---|---|---|---|
耕地 | 林地 | 草地 | 水体 | 建设用地 | ||
原 始 状 态 | 耕地 | 0 | 0.9 | 0.1 | 0.8 | 0.1 |
林地 | 0.7 | 0 | 0.3 | 0.99 | 0.99 | |
草地 | 0.5 | 0.8 | 0 | 0.4 | 0.3 | |
水体 | 0.9 | 0.9 | 0.9 | 0 | 0.99 | |
建设用地 | 1 | 1 | 1 | 1 | 0 |
因此,本文根据1-cost作为限制因子,根据历史时期的土地利用状态分别计算每个时期对应的限制因子,最终将多个时期限制因子进行平均计算。
考虑到近邻范围的影响、不确定因素影响及限制因素影响,通过随机扰动因子
式中:
3 结果与分析
本文根据提出的LSTM-CA模型,以1995—2015年土地利用及驱动因子数据作为基础,模拟2020年土地利用变化,并与MLP-CA模型结果进行对比,模拟对比如表2所示。从表2中可以看出,整体模拟结果与2020年真实土地利用分类结果相似,且2020年土地利用中建设用地呈现出增加的趋势,在实际2020年实际土地利用分布中也可以看出,建设用地面积增加,主要表现在围绕城市中心向四周扩张。为了进一步验证方法的性能,通过局部细节进行对比分析,从第3行中可以看出,LSTM-CA模拟的道路信息更加精细,相对于MLP-CA建设用地的分布更加紧凑,这主要是由于LSTM-CA充分考虑了不同时间各土地类型之间的转换关系; 另外也有效利用了路网等交通因素,同时通过观察可以发现,LSTM-CA模拟的林地噪声更少,主要是由于林地的分布相对稳定,通过多期土地利用分类数据能够有效减少林地分布的不确定性。
表2 2020年土地利用模拟结果
Tab.2
模型 | 研究区 | 区域1 | 区域2 | 区域3 | |||
---|---|---|---|---|---|---|---|
卷积神经网络 | ![]() | ![]() | ![]() | ![]() | |||
MLP-CA | ![]() | ![]() | ![]() | ![]() | |||
LSTM-CA | ![]() | ![]() | ![]() | ![]() | |||
![]() |
为了定量检测方法的模拟结果,将模拟的各土地类型与2020年实际土地类型进行叠加分析,统计得到各类像元一致性对比情况,如表3所示。从总体预测像元数量上来看,LSTM-CA模拟的结果与实际土地利用更为接近,建设用地、耕地、草地、林地及水体的准确率分别94.03%,97.38%,66.61%,97.78%和73.83%,而MLP-CA模拟结果的准确率分别为79.99%,96.27%,67.46%,95.42%和71.32%,除草地结果基本持平外,LSTM-CA其他类别模拟精度均高于MLP-CA结果,可见LSTM-CA方法兼顾了多时期的土地利用类型变化,对于模拟的各土地利用类型像元数量更符合实际情况。
表3 2020年土地利用实际栅格与模拟栅格对比
Tab.3
土地类型 | 实际 | 预测数 | 正确数 | ||
---|---|---|---|---|---|
LSTM- CA | MLP- CA | LSTM- CA | MLP- CA | ||
建设用地 | 249 164 | 252 755 | 222 755 | 234 300 | 199 308 |
耕地 | 906 926 | 944 094 | 983 073 | 883 148 | 873 090 |
草地 | 282 350 | 189 875 | 198 246 | 188 079 | 190 462 |
林地 | 812 165 | 865 210 | 841 694 | 794 167 | 774 944 |
水体 | 27 745 | 26 416 | 32 582 | 20 483 | 19 787 |
为了更好地验证土地类型在空间上的合理性,本文将采用全局点对点的Kappa系数和变化差异对比的FoM(figure of merit)指标作为评价标准。Kappa落在(0,1)间,通常情况下认为Kappa达到0.8以上表现出较高的精度。FoM指标的计算公式为:
式中: A为实际变化但模拟结果未发生变化的单元; B为实际变化同时模拟结果也发生变化的单元; C为实际变化同时模拟结果也变化,但是变化方向不一致的单元; D为实际未变化但模拟结果变化的单元。当FoM指标大于或接近于0.21时,说明模拟结果具有一定的可信度,认为此模型具有较强的适用性。
表4 土地利用模拟结果精度评价
Tab.4
模型 | Kappa | FoM | A | B | C | D |
---|---|---|---|---|---|---|
MLP-CA | 0.87 | 0.22 | 83 993 | 57 672 | 14 139 | 105 574 |
LSTM-CA | 0.90 | 0.39 | 46 747 | 101 779 | 7 278 | 104 148 |
4 结论
本文在CA模型基础上提出了基于LSTM-CA模型用于土地利用变化模拟,以张家口市为研究区,基于1995年、2000年、2005年、2010年、2015年时序土地利用数据,结合距离变量、邻域变量及单元自然属性预测了2020年的土地利用分布情况,与MLP-CA进行精度对比分析,结果表明本文提出的LSTM-CA模型Kappa系数可达0.90,FoM指标为0.39,达到了更高精度。说明该模型能够较充分地挖掘时间序列土地利用之间的时空变换特征,通过历史时序土地利用分类数据及驱动因子构建神经网络模型计算单元发展概率,模拟未来土地利用变化。
然而LSTM-CA也存在一定的局限性,即限制规则根据前人经验获取,因此,未来将继续研究如何更加灵活地获取限制因子,同时考虑更多的驱动因素(如土地政策和社会经济等)是下一步研究的重点。
参考文献
城市元胞自动机扩展邻域效应的测量与校准研究
[J].
DOI:10.11820/dlkxjz.2014.12.005
[本文引用: 2]
城市元胞模型由于在定量分析与预测城市动态的潜力而受到众多研究者的持续关注。邻域规则是主导城市元胞模型模拟过程的关键组件。研究表明,不同土地利用组合间存在显著的邻域效应,且邻域效应具有惯性、排斥和吸引等影响。然而,传统城市元胞模型主要考虑的是特定分辨率下较小窗口的邻域范围。本文尝试刻画更大窗口的邻域效应及其对元胞模型的影响。基于测量的扩展邻域因子,应用粒子群优化算法校准大窗口邻域规则,并创建了考虑扩展邻域效应的城市元胞模型。为验证模型有效性,将其应用于模拟厦门市1995-2010年期间的城市扩张动态。与3×3摩尔邻域的逻辑回归模型相比较,1995-2010年期间的建设用地模拟精度从80.7%提高到83.9%,总体精度从87.8%提高到89.6%,Kappa系数从70.0%提高到74.5%,表明考虑扩展邻域效应的城市模型取得了更好的模拟效果。
Measuring and calibrating extended neighborhood effect of urban cellular automata model based on particle swam optimization
[J].
基于CA-ABM模型的福州城市用地扩张研究
[J].
DOI:10.18306/dlkxjz.2017.05.010
[本文引用: 1]
以中国海西地区重要门户福州市为研究区,结合其地理位置多层次约束性条件,以地理加权回归模型作为元胞自动机(CA)层的转换规则,同时以2000-2015年多期LandsatTM/ETM+影像的城市用地情况为参照,借助GIS空间分析技术,对CA和多智能体(ABM)相耦合的城市用地扩张模型进行改进。然后利用传统的和改进后的CA-ABM模型,多角度、多层次地模拟福州市2000年、2005年、2010年、2015年城市用地扩张在微观格局上的变化。结果表明,传统的和改进后的CA-ABM模型的整体精度均在80%以上,模拟结果具有较强的可信度;改进的 CA-ABM模型模拟的点对点总体精度和Kappa系数均高于传统的CA-ABM模型,而且模拟结果更加接近实际的城市用地扩张分布情况。结论可为平衡城市化进程和合理规划城市用地提供重要的理论技术支撑。
Urban land expansion in Fuzhou City based on coupled cellular automata and agent-based models (CA-ABM)
[J].
DOI:10.18306/dlkxjz.2017.05.010
[本文引用: 1]
Fuzhou City is an important gateway west of the South China Sea. This study uses geographically weighted regression (GWR) as the transformation rules of cellular automata (CA) layer based on the multi-level constraint conditions, taking into account geographical location, natural factors, and the multi-criteria and willingness of various agents to make decisions on environmental change, to simulate urban land expansion of Fuzhou City from 2000 to 2015. Using the urban land use data derived from remote sensing imageries of Fuzhou City in 2000-2015 as a reference, and with the help of GIS spatial analysis technology, this study developed an improved model of urban land expansion based on coupled CA and ABM. The traditional and improved CA-ABM models were used to simulate urban land expansion and change with a microscopic view for Fuzhou City in 2000, 2005, 2010, and 2015 from multiple angles and at multiple levels. The results show that the overall accuracy of the traditional and improved CA-ABM models was higher than 80%, and the simulation results based on the CA-ABM models for Fuzhou City are reliable. The point-to-point overall accuracy and Kappa of the improved CA-ABM model were higher than the traditional CA-ABM model, and the results of the improved CA-ABM model were closer to the actual distribution of urban land expansion in Fuzhou. It indicates that the improved CA-ABM model can be used to simulate urban land expansion, more accurately expresses a variety of geographic processes and mechanisms, and improves the reliability and stability of the simulation results. Finally, a forecast of the distribution of urban land expansion in 2020 and 2030 based on the improved CA-ABM model with scenario natural, economic, and social developments in Fuzhou provides an important theoretical and technical support for the urban land use planning of the city.
多层次矢量元胞自动机建模及土地利用变化模拟
[J].
DOI:10.11821/dlxb202010009
[本文引用: 1]
城市规划对土地利用变化起着重要的引导作用,各层次规划相互支撑、互为补充,自上而下影响着土地利用格局的演变。矢量元胞自动机以不规则的地理实体作为基本单元,可以更逼真地表达客观复杂的城市用地空间结构。然而,当面向具有层次协同性、空间引导性和管控传导性等特征的城市规划时,其元胞多层次体系构造、层次间协同方法和转换规则获取等关键问题凸显出来。本文以江阴市2007年、2012年、2017年3期土地利用现状数据为基础,在多层次矢量元胞自动机建模基础上,模拟了2017年土地利用变化,通过模拟结果与用地现状对比分析,对模型个别参数进行了修正,进一步提高了模型的可行性与适用性,进而预测了2022年城市土地利用格局。模拟结果显示,中心城片区建设用地发展已经趋于饱和,澄南、澄东南和澄东片区建设用地扩张较为明显,有逐步形成“中心城区—城镇组团—村庄”三级城乡空间聚落体系的趋势。最后利用FoM指标对模拟结果进行了评价,得到整体和各片区的精度基本都大于或接近于0.21,表明模拟结果精度较高,其构建的模型在面向多层次规划的用地变化模拟方面具有更好的效果。
Modeling of multi-level vector cellular automata and its simulation of land use change based on urban planning
[J].
高标准粮田区鹤壁市土地利用情景模拟预测研究
[J].
Simulation and prediction of land use in the high standrad grain area of Hebi City
[J].
基于元胞自动机模型的土地利用变化模拟——以大连经济技术开发区为例
[J].
DOI:10.11821/dlxb201503009
[本文引用: 1]
元胞自动机模型已经成为模拟土地利用变化的重要方法。传统土地模拟方法中侧重于通过分析影响土地利用变化的因素来构建预测模型,较少从土地利用类型变化及其相互作用的空间角度来关注模型构建。本文以1998年、2004年和2009年1:10000土地利用数据,利用Python语言结合GDAL与Numpy类库实现局部土地利用竞争的元胞自动机模型原型开发,并用于模拟大连市经济技术开发区1998-2009年土地利用变化模拟。研究结果:① 建立了发掘多地类之间相互作用关系的试验方法,研究适用于具有明确物理意义的多地类元胞自动机模拟模型;② 该模型具有好的模拟精度,对建设用地、农用地和林地等3种不同类型用地进行同时模拟,其对应Kappa系数分别为0.762,0.634和0.678;③ 该模型建立了研究不同种地类协调作用的基本方法,可以用于进一步研究土地利用变化地类之间驱动原理。
LUCC simulation based on the cellular automata simulation:A case study of Dalian Economic and Technological Development Zone
[J].
基于随机森林CA的东莞市多类土地利用变化模拟
[J].
Simulating spatiotemporal change of multiple land use types in Dongguan by using random forest based on cellular automata
[J].
A novel cellular automata model integrated with deep learning for dynamic spatio-temporal land use change simulation
[J].
Theory of self-reproducing automata
[J].
An enhanced support vector machine model for urban expansion prediction
[J].DOI:10.1016/j.compenvurbsys.2019.01.001 URL [本文引用: 2]
Coupling machine learning,tree-based and statistical models with cellular automata to simulate urban growth
[J].DOI:10.1016/j.compenvurbsys.2017.04.002 URL [本文引用: 1]
Mining transition rules of cellular automata for simulating urban expansion by using the deep learning techniques
[J].DOI:10.1080/13658816.2018.1480783 URL [本文引用: 1]
A random forest-cellular automata modelling approach to explore future land use/cover change in Attica (Greece),under different socio-economic realities and scales
[J].
Artificial neural networks and deep learning in urban geography:A systematic review and meta-analysis
[J].DOI:10.1016/j.compenvurbsys.2018.10.008 URL [本文引用: 1]
Dynamic simulation of land use change based on logistic-CA-Markov and WLC-CA-Markov models:A case study in three gorges reservoir area of Chongqing,China
[J].DOI:10.1007/s11356-019-05127-9 URL [本文引用: 1]
Incremental dual-memory lstm in land cover prediction
[C]//
Long time series land cover classification in China from 1982 to 2015 based on Bi-LSTM deep learning
[J].DOI:10.3390/rs11010001 URL [本文引用: 1]
Cellular automata and fractal urban form:A cellular modelling approach to the evolution of urban land-use patterns
[J].DOI:10.1068/a251175 URL [本文引用: 1]
A future land use simulation model (FLUS) for simulating multiple land use scenarios by coupling human and natural effects
[J].DOI:10.1016/j.landurbplan.2017.09.019 URL [本文引用: 1]
/
〈 |
|
〉 |
