基于可控邻域作用CA的城市扩张研究
刘兴权, 吴涛, 甘喜庆
中南大学GIS研究中心,长沙 410083

第一作者简介: 刘兴权(1962-),男,中南大学地学院副院长,教授,主要从事城市GIS、矿山GIS方面的教学与研究工作。

摘要

为了进行城市扩张研究,在使用二分Logistic回归方法从历史数据中挖掘位置特征变量对元胞状态转换影响的基础上,通过引入邻域因子实现了可控邻域作用。研究中,首先建立了一种新的城市元胞自动机(Cellular Automata,CA)模型,然后用该模型在长沙市区及部分周边地区进行了城市扩张进程的模拟和预测,并对结果进行了评价分析。

关键词: 元胞自动机(CA); 可控邻域作用; 城市扩张
中图分类号:TP79F291 文献标志码:A 文章编号:1001-070X(2011)02-0110-05
An Urban Growth Study Based on Controllable Neighbor-effect CA
LIU Xing-quan, WU Tao, GAN Xi-qing
GIS Research Center of CSU, Changsha 410083, China
Abstract

Celluar Automata (CA) featured by self-organizing evolvement is used to establish the urban expansion model. This paper introduces a CA model and adopts a neighbor factor to implement controllable neighbor-effect on the basis of exploring the influence of several location feature variables on cell status conversion in historical data. Obtaining simulated results with different spatial patterns is possible through changing the value of the neighbor factor. Taking the urban district of Changsha and it vicinities as the study area, the authors conducted an experiment to simulate and predict the process of urbanization, and then evaluated and analyzed the results.

Keyword: Cellular Automata (CA); Controllable neighbor-effect; Urban growth
0 引言

随着计算机技术的不断发展, 自20世纪70年代以来, 越来越多的基于元胞自动机(CA)的地理模型, 尤其是城市模型被提出。在国外, 美国Couclelis对CA在地理学中的应用潜力从理论上进行了充分阐述, 尤其是在用CA模拟城市扩张领域[1]; 英国Batty应用分形理论和CA理论对城市的形成和扩展进行了较为深入的研究[2]; Clarke结合大型空间数据库和遥感影像数据, 采用CA模型从宏观以及中观尺度来模拟由道路网、坡度和可开发土地等外部限制因素造成的土地利用变化[3]; White多次应用CA模型成功模拟了土地利用变化[4]。在国内, 以黎夏和叶嘉安等学者也曾将主成分分析法[5]、遗传算法[6]及人工神经网络[7]等方法与CA模型相结合, 在珠江三角洲地区进行了一系列的模拟研究。CA在城市建模领域内的优势在于它能以“ 自下而上” 的演化方式很好地反映出城市发展的自组织特性。但是, 城市这个复杂巨系统的发展除了受到自组织特性的控制之外, 还受到广泛的外部限制因素影响, 如规划因素、自然社会条件因素等; 除此之外, 城市的发展具有显著的不确定性, 即受到随机因素的影响。所以, 标准的CA还不足以真实地对城市发展过程进行模拟, 必须进行适当的扩展。上述各国内外学者所做的工作, 很大程度上都是对标准的CA模型进行扩展, 这些扩展包括向标准的CA模型中引入外部限制因素和引入随机作用影响等。本文在以上扩展的基础上, 着重于对标准CA的邻域作用进行扩展, 通过引入一种邻域作用因子, 并改变该邻域因子的值, 可以模拟出不同空间特征的城市扩张过程。

1 可控邻域作用的城市CA模型

对于任何一种CA模型, 元胞状态转换规则都是其核心。本模型的元胞状态转换规则由位置特征变量作用、邻域作用、约束条件作用以及随机因素作用4个部分构成。整个转换规则的功能是通过这4个部分来判断每个元胞的状态转换概率(由于本文只研究城市的扩张, 故状态转换只包括非城市状态向城市状态的转换), 再将这个概率与一个阈值相比较, 若达到阈值, 则判定该元胞在本次迭代过程中的状态发生转换; 否则, 维持当前状态。

1.1 位置特征变量作用部分

Logistic回归方法是一种用于分类因变量的回归方法, 当因变量可能的取值为0、1时, 称为二分Logistic回归[8]。由于它不假设因变量分布的正态性, 并且克服了一般线性回归因变量范围不受限的弱点, 因此特别适合带有概率判断性质的应用。McMillen和Wu提出用Logistic回归的方法从历史数据中获取一些属性变量来衡量对土地利用类型变化的影响。本文采用二分Logistic回归的方法, 从过去两期土地利用数据中挖掘出如表1所示的4个位置特征变量来评价对元胞状态转换的作用。

表1 参与回归的位置特征变量 Tab.1 Position characteristic variables in regression analysis

将城市状态记为1, 非城市状态记为0, 两期历史数据求差后的值为1即是在该时间段内发生了城市化的元胞, 值为0的即是状态未发生转换的元胞。

Logistic回归方程[8]如下

PLogistic= 11+exp[-(β0+β1dCenter+β2dRoad+β3dRail+β4dWater)](1)

式中, PLogistic表示在4个位置特征变量作用下各元胞的状态转换概率; β 0为常数项, β i(i=1, 2, …, n)为各特征变量的回归系数。

1.2 邻域作用部分

邻域作用是CA转化规则中的重要组成部分, 它体现了CA“ 自下而上” 自组织演变的本质。在本模型中, 邻域函数[8]通过一个5× 5大小的窗口来计算土地利用在空间上的相互影响, 其值按式(2)计算[9], 即

N=1- 209(R-λ )2(2)

式中, N为邻域函数, 其值即邻域作用对元胞状态转换概率的作用值; λ 为邻域因子, 其在(0, 1)范围内取实数值; R为邻域开发率[10], 表示邻域窗口内(不包括中心元胞)的土地开发率, 其计算方法如下

R= 5×5con(si, j=1)5×5-1(3)

式中, con()是一个条件函数, si, j为元胞状态, 如果邻域窗口内(不包括中心元胞)的元胞c(i, j)状态si, j=1, 则返回1, 否则返回0。对其求和后即表示某个元胞的24个邻域元胞中城市元胞的数量。

若邻域函数具体到每一个元胞上, 则邻域作用对该元胞状态转换概率的影响表示为 ptneighbor, 这个值在模型每一步迭代的过程中是不断发生变化的, 因为每个元胞的邻域状态在每一步迭代过程中都有可能发生改变。当邻域开发率取邻域因子λ 时, 则邻域函数值最大, 这表示邻域窗口内有比例为λ 的元胞被开发时, 中心元胞被开发的可能性最大。当开发率接近1或者0时, 由于开发已接近饱和或者周围资源不足, 从而导致中心元胞被开发的可能性相对较小。本文通过引入邻域因子λ 实现了模型邻域作用的可控性。

1.3 约束条件作用部分

非城市用地向城市用地的转化, 除了受上述两部分中的空间变量影响之外, 还受到一些约束条件的影响。例如城市总体规划过程中通常会有一部分土地, 例如重要森林、自然保护区、基本耕地等被划为禁建区; 另外, 受到自然条件的影响, 如地表坡度、土壤性质等, 一部分土地被作为城市用地进行开发的可能性也是相当小的。

受到数据来源的制约, 在本模型中, 只考虑了两个限制因素, 即地表坡度及重要水体。如果某个元胞c(i, j)处的坡度大于25%或者该元胞处于主要的水体之中, 则认为它是不可能向城市元胞发生转化的, 记pconstraint=0, 其表达式如下:

pconstraint=1, g25%ANDc(i, j)Wpconstraint=0, g> 25%ORc(i, j)W(4)

式中, g为地表坡度; c(i, j)代表元胞; W为水体元胞集合。

1.4 随机因素作用部分

城市化过程中通常存在随机因素和偶然事件的影响。为了体现这一点, 本文向模型中加入随机因素的作用。该项可表达为

prandom=1+(-lg γ )α (5)

式中, γ 为(0, 1)范围内的随机数; α 为控制随机变量影响大小的参数, 取值范围是1~10之间的整数。α 的值越大, 模型中随机因素的影响越大; 反之越小。

1.5 综合的元胞状态转换规则

模型的转换规则是上述4个部分的综合, 即

pt=plogistic· ptneighbor· pconstrain· prandom(6)

式中, pt表示t时刻非城市元胞c(i, j)在该转换规则的影响下由非城市元胞向城市元胞转换的概率, 它的值等于式(6)等号右边4个部分的计算结果之积。设定转换概率阈值Tprobability, 比较ptTprobability的大小, 若ptTprobability, 则判定元胞c(i, j)在t+1时刻发生城市化; 反之, 若pt< Tprobability, 则判定元胞c(i, j)在t+1时刻维持原状。

2 实验及结果
2.1 实验区简介

长沙市是中国中部的重要城市之一, 是湖南省的政治、经济、文化中心。改革开放特别是20世纪90年代以来, 长沙市的城市建设得到了极快的发展, 城市扩张的趋势也十分明显。受到TM影像数据来源的影响, 本次实验以长沙市区为中心的矩形区域为研究区域。该区域东至京珠高速以东8 km, 北面越过银盆岭大桥及捞刀河, 西面跨过二环线直至绕城高速, 南面包含了绕城高速以南的大部分区域, 总面积约720多km2

2.2 实验数据及其处理

2.2.1 实验数据

(1)1993年(TM)、1998年(ETM+)、2006年(SPOT 5)3期遥感影像数据, 用来获取3个时间点的土地利用情况;

(2)长沙市1:5万DLG(Digital Line Graphic)数据, 用来获取道路、发展中心及主要水系分布等信息;

(3)90 m分辨率的SRTM影像数据, 用来提取地形坡度信息。

2.2.2 数据处理

遥感影像经过几何纠正、辐射校正及增强处理, 统一成30 m分辨率, 并按照研究区域范围进行剪裁。在Erdas软件平台中对影像进行分类处理, 城市用地编码为1, 非城市用地编码为0。先在ArcGIS中对分类后的1993年及1998年的栅格进行叠加分析, 然后分别将这个时间段内发生城市化和未发生城市化的栅格编码为1与0, 即得到1993~1998年土地利用变化栅格。

从研究区域内的DLG数据中提取出模型所需的发展中心、主要公路、铁路及主要水系, 用ArcGIS中的Euclidean Distance工具求取4个位置特征变量, 栅格大小统一为30 m, 投影系统及区域范围与遥感影像一致。

将90 m分辨率的SRTM影像按研究区域剪裁后用双线性插值方法插值到30 m分辨率, 在ArcGIS中用Slope工具求得坡度栅格后, 再以25%为界进行重分类来得到坡度限制区。从DLG数据中提取出主要水系分布图, 通过将其以30 m栅格大小进行栅格化来得到水系约束区域。在ArcGIS中通过对两个约束区域进行叠加分析来得到综合的约束区域。

2.3 实验过程

实验是在ArcGIS GeoProcessing空间处理框架的支持下, 用ArcGIS Model Builder来实现模型。

首先从1993~1998年土地利用变化栅格以及各位置特征变量栅格中按20%比例进行随机抽样, 并使0和1的比例大致相当, 然后将抽样后的数据在SPSS(Statistical Product and Service Solutions)中进行二分Logistic回归分析, 回归结果见表2

表2 回归系数及其检验 Tab.2 Regression coeffications and test

各系数在0.05的显著性水平上具有统计学意义。这说明4个空间变量确实对土地城市化进程产生影响。其中, 空间变量dWater的系数为正值, 说明该变量越大, 越有利于城市化(统计意义上的影响); 其余3个空间变量的系数均为负值, 说明它们的值越小, 元胞城市化的可能性越大。

由式(1)可知, 在4个空间变量的影响下, 非城市栅格(元胞)向城市栅格(元胞)转换的概率为

PLogistic= 11+exp[-(2.042-0.295dCenter-0.317dRoad-0.108dRail+0.011dWater](7)

得到回归方程后, 即可用CA模型对研究区域内城市化的进程进行模拟。模拟时, 首先对研究区域内1993~1998年、1998~2006年两个时期的城市化过程进行验证性模拟, 然后通过控制邻域因子模拟来对研究区域2006年以后的城市化进程进行不同空间形态特征的预测性模拟。

2.4 实验结果

在CA模拟中, 阈值Tprobability的选取以及每次模拟迭代的步长, 都需要在模型中反复校正。同时, 在模拟中, Tprobability的选取与迭代的步长密切相关。考虑到本次实验数据的实际情况, 模拟中设定迭代步长为1 a。为了校正模型, 将阈值Tprobability的选择区间设为0.4~0.9, 从下限开始测试, 每次测试完成后, 将阈值Tprobability提高0.01进入下一次测试。在测试中, 以1993年为起始数据, 同样要找到与某一特定阈值Tprobability相适应的最佳迭代次数组合。利用长沙市历史影响数据对模型进行校正, 得到的最佳模拟效果组合, 可以把模拟数据分为1993~1998年和1998~2006年两个时间段, 以获得最佳精度。邻域因子λ 的取值反映了元胞被开发的可能性。本次实验考察的是城市化拓展过程, 即非城市用地被开发的过程, 经测试, 比较合适的邻域因子λ 取值为0.6。

1993~1998年阶段模拟取转换阈值Tprobability=0.75, 邻域因子λ =0.6, 随机作用参数α =1, 迭代步长1 a, 起始数据为1993年土地利用栅格, 迭代5次后, 得到1998年模拟的城市化情况。按混淆矩阵评定法, 模型总体模拟精度为87.92%, Kappa=0.669。

1998~2006年阶段模拟取Tprobability=0.75, 邻域因子λ =0.6, 随机作用参数α =1, 迭代步长1 a, 起始数据为1998年(实际)的土地利用栅格, 迭代8次后, 得到模拟的2006年城市化情况。按混淆矩阵评定法, 模型总体模拟精度为76.51%, Kappa=0.500。与1993~1998年的模拟相比, 精度有所下降。分析其原因, 主要是由发展中心数据中缺少该阶段部分相应的发展中心所引起。

2006年后的模拟属于预测性的模拟。为了检验邻域因子λ 在控制空间形态形成中的作用, 分别采用5组参数进行模拟。继承上一时间段的转换阈值Tprobability=0.70, 随机因子α 控制在1, 邻域因子λ 分别取0.25、0.4、0.55、0.7及0.85, 模拟迭代终点为2022年, 共迭代16次。对比模拟结果可以发现, 空间形态有显著差异。直观上看, 这5组参数的模拟结果都可以反映出研究区域内的城市扩张过程主要以蔓延模式和沿道路发展模式为主。

为了定量地比较5组参数所形成的城市空间形态之间的差异, 用Fragstat 3.3软件分别计算5种与模拟城市空间形态对应的周长-面积分形维数D。周长-面积分形维数D是一个用来描述空间形态复杂性的指标, 其取值范围是1≤ D≤ 2。当D值趋近于1时, 说明空间形态越简单, 破碎程度越低; 当D值趋近于2时, 说明空间形态越复杂, 破碎程度越高。

5组参数得到的D值分别为1.516 2、1.457 4、1.395 2、1.385 3、1.301 2, D值随λ 的变化如图1所示。

图1 周长-面积分形维数D值随邻域因子λ 的变化趋势Fig.1 PAFRAC’ s variation trend with neighborhood factor λ

图1可以看出, 随着邻域因子λ 的增大, 周长-面积分形维数D值不断下降, 也就是说, λ 的增大会导致模拟的城市空间形态趋于破碎和零散, 紧凑程度减小。因此可以利用这个特性来模拟不同规划条件及目的下的城市空间形态。

3 结论

本文利用元胞自动机的建模思想, 在标准CA模型的基础上, 首先建立了一种约束Logistic-CA模型, 然后通过回归方法从历史数据中挖掘出建模需要的位置特征变量, 并用该模型对长沙市城市化过程中的空间形态演变进行了模拟和预测。经过多次测试和评价模拟精度, 确定了适合该地区数据分布特点的参数组合。模拟结果表明, 采用元胞自动机进行土地利用变化预测模拟, 对于研究城市化过程中的空间形态变化有着重要意义。

本模型仅仅考虑了非城市元胞向城市元胞的转换, 但是实际的城市发展必定会存在城市用地向非城市用地退化的现象, 这在进一步的工作中需要加以完善。多分Logistic回归方法可能是一个解决的办法。另外, 邻域作用曲线也可以考虑由抛物线改为其他更为合理的函数曲线。

The authors have declared that no competing interests exist.

参考文献
[1] Couclelis H. Cellular Worlds: a Framework for Modeling Micro-Macro Dynamics[J]. Enviroment and Planning A, 1985, 17(5): 585-596. [本文引用:1]
[2] Batty M. Cellular Automata and Urban Form: A Primer[J]. Journal of the American Planning Association, 1997, 63(2): 266-274. [本文引用:1]
[3] Clarke K C, Gaydos L J. Loose-coupling a Cellular Automata Model and GIS: Long-term Urban Growth Prediction for San Francisco and Washington/Baltimore[J]. International Journal of Geographical Information Science, 1998, 12(7): 699-714. [本文引用:1] [JCR: 1.479]
[4] White R, Engelen G, Uijee I. The Use of Constrained Cellular Automata for High-resolution Modeling of Urban Land -use Dynamics[J]. Environment and Planning B, 1997, 24(3): 323-343. [本文引用:1]
[5] 黎夏, 叶嘉安. 主成分分析与Cellular Automata在空间决策与城市模拟钟的应用[J]. 中国科学, 2001, 31(8): 683-690. [本文引用:1]
[6] 黎夏, 叶嘉安. 遗传算法GIS结合进行空间优化决策的研究[J]. 地理学报, 2004, 59(5): 745-753. [本文引用:1]
[7] 黎夏, 叶嘉安. 基于神经网络的单元自动机CA及真实和优化的城市模拟[J]. 地理学报, 2002, 57(2): 159-166. [本文引用:1]
[8] 王济川, 郭志刚. Logistic回归模型——方法与应用[M]. 北京: 高等教育出版社, 2007. [本文引用:3]
[9] 罗平. 地理特征元胞自动机及城市土地利用演化研究[D]. 武汉: 武汉大学, 2004. [本文引用:1]
[10] 黎夏, 刘小平. 基于案例推理的元胞自动机及大区域城市演变模拟[J]. 地理学报, 2007, 62(10): 1097-1109. [本文引用:1]