第一作者简介: 陈 婷(1980-), 女, 博士, 工程师, 主要从事“北京一号”卫星数据处理与遥感应用研究。 E-mail:chenting@21stc.com.cn。
针对全色图像的冰雪识别问题,以过渡区理论为基础,提出基于过渡区特征的冰雪识别方法。首先利用K-均值聚类方法分离云、雪与其他地物,再通过SUSAN(smallest univalue segment assimilating nucleus)边缘检测提取过渡区图像; 然后设立描述过渡区大小的特征量——厚度,并与过渡区的均值和方差特征量组合成特征向量,用以分析过渡区特征,识别具有冰雪过渡区特征的点,构成冰雪边界; 最后经过边界生长和区域填充,实现冰雪识别。以“北京一号”小卫星全色图像为遥感数据源,应用该方法及过渡区阈值法、迭代自组织法和面向对象纹理分析法分别提取冰雪覆盖区。该方法的冰雪识别精度达到97.39%,明显高于其他识别方法,表明该方法能获得较高精度的冰雪识别结果和丰富的边缘信息,可为云雪分离及雪线提取等方法研究提供参考。
In order to accurately identify ice or snow and obtain the range, this paper presents a new recognition method based on transition region feature for high spatial resolution panchromatic remote sensing imagery. Firstly, the high reflection region including snow or ice and cloud was extracted by K-means cluster analysis. Secondly, the transition region was segmented by SUSAN edge detection. Then, the average, variance and thickness were chosen as the transition region feature vectors to differentiate ice or snow pixels as the target boundary. Finally, the snow or ice area was obtained by edge growing and region filling. The “Beijing-1” high spatial resolution panchromatic remote sensing image was selected to identify the ice or snow area by transition region feature, and the recognition precision reached 97.39%. A comparison of the experimental results with those of other methods shows that the accuracy of the transition region feature analysis is obviously improved. The application analysis indicates that the method of ice and snow recognition based on transition region feature can obtain higher precision of results and more details of edges, and can also provide the references for separating the cloud and snow and extracting the snow line.
20世纪30年代, 研究者提出了过渡区的概念[1]。1979年Weszka等[2]首次将过渡区理论引入图像处理领域。章毓晋[3]在20世纪90年代后期比较全面地研究了过渡区的理论, 且明确指出图像的过渡区像点是由背景和目标之间的部分像点构成的, 过渡区的空间位置位于背景与目标之间, 过渡区的灰度范围处于背景灰度均值与目标灰度均值之间。地表现象所固有的模糊性证明了对地观测遥感图像中过渡区的存在[4, 5], 而地表的复杂性则反映了遥感图像中不同地物过渡区特征的差异性。基于图像分割理论, 2003年肖晓玲等[5]利用有效平均梯度提取了遥感图像的目标过渡区。2009年闫成新[6]使用局部复杂度参数提取了遥感图像的过渡区。但目前对过渡区的研究仅限于为分割图像确定阈值提供参考, 而对其进行特征描述及应用分析、并应用于地物分类识别的研究还较少。
我国基于遥感图像的冰雪识别研究早在1985年初即已开始[7], 近年来基于光学遥感数据的冰雪信息提取方面取得了显著成果, 冰雪识别方法研究不再单纯依靠单一的光谱信息, 而是加入了地物的空间结构信息, 例如: 2006年陈刚等[8]综合光谱与纹理特征进行了云雪分离; 2009年龚剑明等[9]在提取冰川时引入了形状特征, 但受遥感图像空间分辨率及空间结构信息限制, 识别精度无法大幅提高。随着星载遥感图像的地面采样间隔逐渐缩小, 具有高空间结构性特点的全色高分辨率遥感图像为冰雪识别提供了新的数据基础。面对部分云与雪分离的难点, 考虑到全色数据中冰雪的内部特征与云具有相似性, 根据形状、纹理特征无法精确区分云雪, 本文提出了另一个反映地物空间结构的特征— — 过渡区特征, 并基于过渡区的特征分析识别冰雪像点, 再利用邻域填充方法最终提取冰雪区。采用“ 北京一号” 小卫星全色图像为数据源的应用实验表明, 该方法能够明显提高冰雪识别的精度。
合适的特征选择和优化是设计模式识别系统中十分重要的环节。图像中过渡区具有2方面特点: ①将不同的区域分割开来, 具有边界的特点; ②面积不为零, 具有区域的特点。不同地物的过渡区具有明显差异(如大小、灰度、纹理等), 因此可根据过渡区的边界性和区域性来判识像点是否属于目标。
为体现过渡区的边界性特征, 本文提出一个新的描述因子— — 厚度, 即过渡区邻域范围内过渡区像点出现的数量; 为体现过渡区的区域性特征, 选择过渡区像点邻域的均值和方差作为描述因子。其中, 均值主要检测过渡区像点的纯度, 方差主要检测过渡点的均匀性, 厚度主要检测过渡区的大小。上述特征的计算方法是以过渡区像点E(x, y)为引导, 计算其邻域矩形范围内过渡区像点的均值、方差及厚度, 作为分析过渡区特征的特征向量。设过渡区图像t(x, y), 采用尺寸为k× k的模板, 令m=(k-1)/2, 则对应的均值μ 、方差σ 2和厚度n的特征量计算公式分别为
μ (x, y)=
σ 2(x, y)=
n(x, y)=
式(3)中: E(x, y)为过渡区像点; n(x, y)为(x, y)点的边界厚度。
由式(1)— (3)计算每个过渡区边界点的邻域特征向量V为
V=(μ , σ 2, n)。 (4)
本文使用 “ 北京一号” 小卫星的全色图像, 其波谱范围是500~800 nm, 刈幅宽度为24 km, 空间分辨率为4 m, 通过卫星侧摆可实现5~7 d的重访。图像纹理结构清晰, 几何性能好, 没有局部几何失真或变形, 且色调层次丰富, 具有较高的可判读性, 可为冰雪识别提供高分辨率和高空间结构信息的数据。
在全色遥感图像的冰雪识别中, 云和雪的区分是主要技术难点之一[10]。通过分析云和雪的特性发现, 与云雾易变的表面特征相比, 冰雪表面特征相对稳定; 尤其是冰雪边界比云清晰, 且冰雪具有相对统一的反射率(图1)。云雾和冰雪的上述物理特性反映在遥感图像上即为过渡区的差异, 因此, 可通过选择和优化过渡区的特征来分析和识别冰雪覆盖区[11]。
将云和雪具有高相似度、高反射率的区域称为“ 中心区” ; 将表面粗糙、灰度值不稳定、向另一地物过渡的区域称为“ 过渡区” 。本文通过边缘检测提取出过渡区, 根据过渡区的特征向量判断过渡区内的点是否为目标点, 进而实现图像识别。具体实现方法为: ①聚类分析。根据光谱特征, 区分云雪与其他地物; ②过渡区提取。基于高梯度像点定义过渡区, 逼近云雪中心区; ③过渡区特征分析。统计过渡区像点的特征向量, 提取目标边界点; ④边界生长。通过邻域特征分析得到的边界可能是间断、不连续的, 不能保证区域的封闭型, 因此采用边界生长连接间断的边界; ⑤区域填充。为提取冰雪区域, 根据区域生长原理, 采用基于边界的区域生长方法, 递归完成区域填充。
根据地物光谱仪测定的光谱曲线可知, 在可见光波段, 云、雪与其他地物具有明显的差异[12]。K均值(K-means)聚类算法依照“ 到聚类中心距离的平方和最小” 的原则, 可将具有高反射光谱特征的点提取出来。本文设计分类数为3, 从运算速度及区域获取精度考虑, 设计最大迭代次数为1; 随机提取3个样本作为聚类中心, 计算每个样本到这3个聚类中心的距离, 找出最小距离把样本归入最近的聚类中心; 修改中心点的值为本类所有样本的均值, 再计算各个样本到3个聚类中心的距离, 重新归类; 修改新的中心点, 直到新的中心点等于上一次的中心点时结束。
该方法以给定的初始类数量迭代找到最好的聚类结果, 提取的第3类即为高反射目标区; 以距离作为样本相似性度量, 可有效地汇集云、雪高反射区(程序实现过程详见文献[13])。
为了增强过渡区的边界特性, 本文利用边缘检测的方法进行梯度增强, 使用梯度算子对图像进行卷积运算得到梯度图像, 提取大于设定阈值的像点构成过渡区。不同梯度算子对提取过渡区具有差异[14], 主要原因是受图像噪声的影响, 故本文选择抗噪声能力强的SUSAN(smallest univalue segment assimilating nucleus)梯度算子实现边缘检测。
SUSAN算子采用圆形模板得到全方向的响应, 用一个含有37个像点的模板P(x, y)排成7行, 各行分别有3, 5, 7, 7, 7, 5, 3个像元(图2)。
对比模板内每个像点灰度值与核的灰度值, 则有
C(x0, y0; x, y)=
式中: (x0, y0)为模板P(x, y)中核像点在图像中的位置坐标; (x, y)为模板P(x, y)中其他像点在图像中的位置坐标; f(x0, y0)和f(x, y)分别为在(x0, y0)和(x, y)处像点的灰度; T为灰度阈值, 一般设T=27; C (x0, y0; x, y)为输出的比较结果。根据USAN(uivalue segment assimilating nucleus)原理, 初始的边界响应R(x0, y0)为
R(x0, y0)=
式中: S(x0, y0)=
此方法无需计算微分即可消除噪声影响, 并可同时检测边界和角点, 不随尺度的变化而改变所检测出的边界位置, 且控制参数简单, 任意性小, 比较容易实现边界的自动化选取[15]; 此算法的另一优势在于边缘阈值的确定性, 提取阈值为0的像点组成过渡区。
通过SUSAN边界检测, 标记了最大可能为冰雪的过渡区。遥感图像中云、雪过渡区的灰度值变化差异较大, 雪的灰度值具有突变特点, 但云的灰度值变化缓慢。以SUSAN检测的边界点为中心, 构建过渡区的特征向量。记录SUSAN检测的边界点位置E(x, y), 计算边界点(x, y)的邻域(25像元× 25像元方形范围)内的像点均值、方差和厚度, 组合成特征向量V, 即
V=(μ , σ 2, n), (7)
式中: μ 为灰度平均值; σ 2为方差; n为厚度。
对不同区域云、雪边界进行特征采样, 计算冰雪边界特征均值向量
式中:
若
通过上述特征分析, 不仅确定了冰雪过渡区像点, 同时提取了具有高梯度特征的积雪边界。由于全局阈值分割的影响, 使提取的积雪边界可能是断裂而不连续的, 甚至经过形态学运算仍不能保证边界的连续性, 因此需要针对边界信息进行后处理。
对经过邻域分析后的图像和SUSAN边界图像进行基于数学形态学的边界细化, 并运用3× 3模板对边界图像进行击中运算, 得到边界中心骨架, 边界点标记为1, 背景点记为0。进行边界生长首先寻找边界断裂端点, 依计算模板(图3)定义边界点是中心标记为1并且其8个连通邻域内至少有2个点标记为1的点。
以p1为中心点, 其邻域的8个点顺时针绕中心点, 分别记为p2, p3, …, p9(其中p2在p1的上方)。断点标记须满足条件N(p1)≥ 2, N(p1)是p1的非零邻点的个数。对全部边界点检验完毕后, 对所有的端点进行标记。首先按照文献[16]的边界生长方法, 搜索断裂点半径r(r为断裂边界长度)范围内是否有边界点。如果有, 则以端点为起点, 综合SUSAN边界细化结果, 依SUSAN边界走向连接端点; 否则, 停止生长, 并放弃该断裂边界。
该算法优点是: ①边界生长充分考虑到雪边界的性质(高梯度); ②不限制断裂边界的长度。如果按照给定的模板进行边界生长, 则有可能出现与实际图像不符的现象(如产生过分割现象), 或保证不了边界的连续性、封闭性等。
经过上述边界提取, 认为绝大部分的边界已经闭合, 根据区域生长方法及冰雪灰度特征, 本文采用基于边界的向内区域生长方法[17]进行区域填充。以边界点为中心, 提取全色图像中3× 3模板内大于或等于中心点灰度值的所有像点, 标记为1; 小于中心点灰度值的像点位置标记为0。以此模板遍历全图像, 直到中心点及邻域点的像点均为1, 停止生长, 生成冰雪覆盖区图像。
冰川积雪是我国干旱、半干旱地区河流与地下水的主要补给来源, 是局部区域水文循环及生态系统的重要组成部分, 也是研究气候变化乃至全球环境变化的重要因子[18]。以“ 北京一号” 小卫星全色传感器获取的唐古拉山脉图像为例, 进行基于过渡区特征识别冰雪覆盖区的实验。
“ 北京一号” 小卫星全色图像的获取日期为2006-09-18, 空间分辨率为4 m, 大小为2 017像元× 1 654像元。该图像覆盖青藏高原唐古拉山脉东段的冰川雪盖, 主要由冰川积雪、云、高寒荒漠、河流等组成(图4(a)), 适合于进行冰雪覆盖区识别的实验。
对经过辐射校正、几何纠正等预处理后的“ 北京一号” 小卫星全色图像, 按前述冰雪识别方法进行处理: ①通过K-means聚类提取第3类反射率较高的图像, 区分云、雪与其他地物; ②对云雪图像通过SUSAN检测提取值为0的点为过渡区; ③采用25× 25窗口计算过渡区像点的特征向量; ④依据1 000个采样点计算冰雪均值特征向量
将过渡区特征法(图4(c))、过渡区阈值分割法(图4(d))、迭代自组织数据分析(ISODATA)法(图4(e))和面向对象的纹理分析法识别结果(图4(f))与目视解译结果(图4(b))对比, 可以看出阈值法和ISODATA法的识别结果中将部分高反射的云中心区错分为冰雪; 面向对象识别结果中将北部部分冰雪区漏分, 部分云区被错分为冰雪; 过渡区特征法的识别结果中, 只遗漏了少量小冰雪区, 冰雪识别结果与目视解译结果基本一致。
以目视识别为真实结果, 统计各方法结果的精度及Kappa系数(表1)。由表1可以看出, 基于过渡区特征的冰雪识别总体精度最高(达到97.39%, Kappa=0.944 7), 阈值法识别精度最低(只有93.75%, Kappa=0.871 2)。由于冰雪识别结果为二值图像, 错分与漏分误差对比存在一定的互补关系, 过渡区特征法的错分误差最低, 阈值法的错分误差最高。
| 表1 不同识别方法的结果精度统计 Tab.1 Precision statistics of the rusults from the different identification algorithms |
综合分析不同算法与结果精度可知, 过渡区的阈值分割法方法简单、处理速度快, 但冰雪识别面积比目视解译结果大, 主要是由于过渡区的阈值往往偏低, 冰雪提取区域无法完全分离云和雪; 用迭代自组织数据分析方法进行分割, 无法准确区分云和雪; 面向对象的纹理分析方法在操作中涉及更多的参数(如尺度选择和形状权重等), 诸多参数的确定对运算量及处理结果影响较大。本文提出的基于过渡区特征的识别方法, 在总体识别冰雪范围上精度较高, 错分误差较低; 但漏分误差较高, 究其原因, 漏分部分为薄云阴影遮挡区, 具有和云雾相似的过渡区特征, 因而导致冰雪的漏判。
根据遥感图像中任何地物均有过渡区、且不同地物的过渡区特征也不相同的特点, 本文通过分析冰雪的物理特征, 建立了基于过渡区的特征描述、并基于聚类分析和SUSAN检测方法获得云雪过渡区; 对比过渡区特征描述因子, 确定冰雪像点; 再经过边界生长和区域填充方法获得冰雪覆盖区的冰雪识别方法。以“ 北京一号” 小卫星的全色图像为实验数据, 应用本文方法实现了对冰雪的识别, 得出如下结论:
1)基于过渡区厚度、方差与均值的特征向量, 描述方法简单, 符合地物物理特性, 且冰雪特征差异显著。
2)本文提出的过渡区特征法识别冰雪的精度显著提高, 其总体精度达97.39%, 明显高于过渡区阈值法等其他方法。
3)用过渡区特征法的冰雪识别结果中细节丰富, 并避免了同质判别函数限制, 为雪线的提取和云雪分离方法研究提供了参考。
综合分析过渡区特征法的复杂程度、运算速度和识别精度, 发现在2个方面仍有待进一步完善: ①识别过程中迭代次数过多, 运算量较大, 需进一步改进算法、提高效率; ②冰雪上薄云阴影的特征有待加入特征分析过程中, 以进一步提高冰雪识别精度。
The authors have declared that no competing interests exist.
| [1] |
|
| [2] |
|
| [3] |
|
| [4] |
|
| [5] |
|
| [6] |
|
| [7] |
|
| [8] |
|
| [9] |
|
| [10] |
|
| [11] |
|
| [12] |
|
| [13] |
|
| [14] |
|
| [15] |
|
| [16] |
|
| [17] |
|
| [18] |
|

