K-means聚类引导的无人机遥感图像阈值分类方法
A K-means clustering-guided threshold-based approach to classifying UAV remote sensed images
通讯作者: 王章琼(1984-),男,博士,副教授,研究方向为地质灾害调查、岩石力学、智能技术。Email:wzqcug@163.com。
责任编辑: 张仙
收稿日期: 2020-09-23 修回日期: 2020-12-3
基金资助: |
|
Received: 2020-09-23 Revised: 2020-12-3
作者简介 About authors
白俊龙(1997-),男,硕士研究生,研究方向为遥感解译、图像处理。Email:
针对无人机获取的高分辨率遥感图像分类需求,提出一种K-means聚类引导的阈值分类方法。首先计算出无人机遥感图像数据集的Average Silhouette值,作为K-means的最优聚类数目; 然后对原始图像进行K-means聚类初分割,对初分割结果中的非目标区域进行手工剔除; 再对处理之后的新对象进行阈值分割和图像优化,完成对象的提取; 最后对所有处理得到的地物标签进行合并,实现遥感图像的识别与分类。基于MATLAB/GUI平台,对提出的分类方法处理步骤进行集成,开发了无人机遥感图像分类处理系统,可对无人机遥感图像进行快速处理,实现半自动解译。对分类结果进行精度验证,其总体精度为91.09%,Kappa系数为0.88,表明该方法用于无人机遥感图像分类处理,能够实现地物的精确分类与信息提取。
关键词:
This study proposed a K-means clustering-guided threshold-based approach to classifying the high-resolution remote sensing images obtained using unmanned aerial vehicles (UAVs). The steps of the approach are as follows. First, calculate the average silhouette of the UAV remote sensing image dataset as the optimal number of clusters in the K-means clustering. Then perform K-means clustering on the original images, and manually remove non-target areas in the initial segmentation results. Afterward, perform threshold-based segmentation and image optimization on the new objects obtained to extract objects. Finally, combine all the feature tags obtained to realize the recognition and classification of remote sensing images. The abovementioned processing steps were integrated using the MATLAB/GUI platform. Based on this, a classification processing system of UAV remote sensing images was developed. It can quickly process UAV remote sensing images and achieve semi-automatic interpretation. The accuracy of the classification results was verified, obtaining an overall accuracy of 91.09% and a Kappa coefficient of 0.88. This indicates that the approach proposed in this paper can obtain high-quality segmentation results of UAV remote sensing images.
Keywords:
本文引用格式
白俊龙, 王章琼, 闫海涛.
BAI Junlong, WANG Zhangqiong, YAN Haitao.
0 引言
无人机遥感技术以其时效性强、机动灵活、获取成本较低等优势得以快速发展[1],应用范围也日趋广泛,是传统遥感手段的有力补充[2,3]。近年来,为充分利用无人机遥感影像丰富的信息数据,避免“数据丰富,信息贫乏”[4,5]现象的出现,越来越多的研究者开始了高分辨率遥感图像的处理研究[6]。基于机器学习的图像分类方法是现阶段的研究热点与重点 [7],但此类方法通常需要提供大量的训练样本来保证后续的分类精度[8,9],且目前各相关领域能够满足模型训练条件的训练样本数据十分稀少,导致该方法还难以用于实际工程应用。而无监督聚类方法不需要训练样本,仅凭地物地磁辐射强弱在遥感图像上所反映的光谱信息,即可将数据按其自然分布特性进行聚类,自动判别地物类别,并能克服人工解译所带来的主观性因素影响[10]。
鉴于K-means算法的优点与缺点,结合无人机高分辨率遥感图像的特点,本文提出一种K-means聚类引导的阈值分类方法。首先采用K-means聚类对图像进行聚类处理,实现图像的初始分割,其中利用Average Silhouette指标值来定量确定最优聚类数目k; 然后对初始分割结果进行阈值分割和图像优化处理完成对象的提取; 再对所有提取结果进行合并实现全图的识别与分类。并基于本文提出的分类方法处理步骤,采用MATLAB/GUI平台,设计了适用于无人机遥感图像分类处理系统。
1 K-means聚类引导的阈值分类方法
1.1 K-means聚类
1.2 聚类数目k的确定
由此可以看出,聚类个数k值选取是否得当会直接影响最终的聚类效果,故使用K-means算法进行聚类首先需要确定一个合适的k值。传统K-means聚类过程中k值多依靠经验确定,聚类结果容易陷入局部最优。本文利用Average Silhouette指标值来定量确定最优聚类数目k,从而提高初分割精度与处理效率、减少后续手动处理步骤。轮廓图(Silhouette)是一种用来刻画聚类效果的度量,每个点的Silhouette值都表示相比于其他簇,这个点与本簇内的其他点的相似程度。
对于样本点i,其Silhouette值[17]Si的计算公式如下:
式中: ai为点i与当前所属簇的差异度,通常用到达各点的平均欧氏距离度量; bi为点i与不同簇中其他点距离平均值的最小值。Si的取值范围为[-1,1],Si值越大(越接近1),表示点i与同簇内的点相似程度越高,与不同簇的点相异程度越高,即分类结果越好。
图1
图1
聚类数目与Average Silhouette值关系示意图
Fig.1
Schematic diagram of the relationship between the number of clusters and the Average Silhouette value
1.3 分类步骤
本文提出K-means聚类引导的无人机遥感图像阈值分类方法,主要包括以下步骤:
1)根据已有的无人机遥感图像数据计算Average Silhouette指标值,确定当前图像数据集的最优聚类数目k值; 对待处理图像进行K-means聚类初分割; 根据K-means聚类结果,目视判定对象类别,将同类别对象进行组合并手工剔除非目标区域,得到新对象。
2)对新对象进行阈值分割,将得到的二值图像进行形态学等优化处理。
3)重复步骤1)和2)直至完成所有区域的处理。
4)最后对处理完的所有区域进行合并,得到完整分类结果。
具体分类流程参见图2。
图2
图2
K-means聚类引导的阈值分类流程
Fig.2
The process of threshold classification under K-means clustering guidance
基于MATLAB/GUI平台,对本文提出的分类方法处理步骤进行集成,开发了无人机遥感图像分类处理系统,后续使用该系统完成无人机遥感图像分类的全部处理,系统操作界面如图3所示。
图3
2 K-means聚类引导的图像阈值分类
2.1 原始图像与k值确定
图4
从采用无人机遥感系统获取的高分辨率遥感图像数据来看,针对同一批次的无人机遥感图像数据集,无人机的飞行高度相对固定,单张图像覆盖的面积范围有限,各张遥感图像中所包含的地物类别数量相对较少且基本相等,故处理同一批次的遥感图像数据,只需计算1个k值。通过对本次获取的无人机遥感图像数据集进行大量测试验证,根据式(1)计算对应的Silhouette指标值,并根据聚类数目与Average Silhouette指标值的关系曲线图(图5),可以确定一个最优聚类数目k为4,故在使用K-means对图像进行聚类时,不会陷入局部最优,提高后续处理效率。
图5
图5
聚类数目与Average Silhouette值的关系
Fig.5
Relationship between the number of clusters and the Average Silhouette value
2.2 K-means聚类初分割
图6
图7
2.3 阈值分割与优化
处理得到完整的“林地、草地”区域后,需对图像进行阈值分割和进一步的优化处理,生成二值图像。使用可视化图像阈值选择GUI工具对“林地、草地”进行阈值分割,thresh_tool函数会先自动计算出一个自适应阈值,通常能对图像进行很好地分割; 若不满意该结果,也可左右移动灰度直方图中的阈值灰色竖线,调整阈值直至最佳分割效果。如图8所示,对“林地、草地”进行分割的阈值为32。无人机遥感图像分辨率高,在使用K-means聚类对两种相互交融的地物(林地之间的其他土地)进行初分割时,难以得到精准的边界,进行阈值分割之后得到的二值图像往往包含背景噪声。中值滤波是一种非线性操作,使用medfilt2函数对二值图进行中值滤波,可以滤除图中的椒盐噪声,同时保留边缘。再使用imfill函数对图中的密集独立的的孔洞区域进行填充使其连成一整块区域,实现二值图像的优化处理(图9)。
图8
图9
2.4 标记与合并
通过bwlabel函数对二值图像中各个分离部分进行标注,返回一个和二值图像大小相同的标记矩阵L,包含了二值图像中每个连通区域的类别标签。前面经过K-means初分割和阈值分割之后得到的对象中只包含一种地物,故标记矩阵L中只有一种类别标签,其对应的标签值为1。使用label2rgb函数,可将标记矩阵L转换为伪色彩图像,至此即完成“林地、草地”的识别与标记提取。重复上述步骤,分别完成剩下K-means聚类结果的处理,最终从原始图像中识别出“林地、草地”,“水域”,“交通运输用地”和“其他土地”4类地物。
对4类地物标签进行合并,得到彩色标记矩阵,将原始遥感图像与彩色标记矩阵叠加即为最终的图像分类结果。图10为设计的无人机遥感图像处理系统子界面。由图可知,该界面除了对地物标签进行合并与展示最终的分类结果外,还可以计算某类地物的像素面积大小及其占全图总面积的比值。
图10
3 结果与分析
3.1 精度评价指标
混淆矩阵分析是进行图像分类精度评价的常用方法[20]。本文使用混淆矩阵计算出的生产者精度、用户精度、总体精度和Kappa系数作为评价指标,对无人机遥感图像分类结果进行精度评价和分析。
1)生产者精度(producer’s accuracy, PA)。表示在分类中某一类别被正确分类的像元数与此类别真实参考像元之间的比率,公式为:
式中: xii为i类地物正确分类的像元数目; x+i为第i列的总像元数量。
2)用户精度(user’s accuracy, UA)。指正确分到某类的像元总数与所有被分为该类的像元总数之间的比率,公式为:
式中,xi+为第i行的总像元数。
3)总体分类精度(overall accuracy, OA)。指被正确分类的像元个数与总像元个数的比值,公式为:
式中: n为总类别数; N为用于精度评估的像素总数。
4)Kappa系数。用于检验遥感图像分类对于真实地物判断的正确性程度,可以反映所分类别与遥感图像之间的一致性。Kappa系数通常介于0~1之间,Kappa值越大表示分类精度越高。公式为:
3.2 精度评价
利用449个验证样本点数据,分别建立4种土地利用类型数据集在整体区域的混淆矩阵(表1),计算出的OA为91.09%,Kappa系数为0.88。可见,使用本文方法对无人机遥感图像分类得到的OA和Kappa系数都很高,说明分类结果与地表真实信息的总体一致性程度高,该方法适用于无人机遥感图像的分类处理。
表1 混淆矩阵
Tab.1
分类后土地利用类型 | 真实土地利用类型 | |||||
---|---|---|---|---|---|---|
林地、草地 | 水域 | 交通运输用地 | 其他土地 | 行总计 | UA/% | |
林地、草地 | 148 | 2 | 0 | 14 | 164 | 90.24 |
水域 | 0 | 91 | 0 | 1 | 92 | 98.91 |
交通运输用地 | 0 | 0 | 68 | 1 | 69 | 98.55 |
其他土地 | 13 | 5 | 4 | 102 | 124 | 82.26 |
列总计 | 161 | 98 | 72 | 118 | 449 | — |
PA/% | 91.93 | 92.86 | 94.44 | 86.44 | — | — |
OA=91.09%; Kappa系数=0.88 |
根据表1可知,用户精度: 水域>交通运输用地>林地、草地>其他土地; 生产者精度: 交通运输用地>水域>林地、草地>其他土地。可以发现其他土地利用类型的UA和PA均为最低,林地、草地次之,分析其原因,该类型分类精度低是因为紧挨林地、草地的其他土地对象中混入部分林地、草地所致; 水域和交通运输用地的两种精度都很高,是因为水域多呈面状或带状分布,交通运输用地呈带状分布,区域内地物分布均匀、单一,且这两种形状与其他地物接触通常有较为明显的边界,易于识别区分。
4 结论
1)本文提出了K-means聚类引导的阈值分类方法用于无人机遥感图像的分类处理,并基于Matlab/GUI平台,对该方法处理步骤进行集成,开发了无人机遥感图像分类处理系统。
2)根据Average Silhouette指标值与聚类数目之间的关系,确定出采用K-means聚类对无人机遥感图像数据进行处理的最优聚类数目为4。
3)对无人机遥感图像进行分类处理,取得的OA为91.09%,Kappa系数为0.88,表明了该方法用于无人机遥感图像分类处理,能够实现地物的精确分类与信息提取。
参考文献
Unmanned aerial systems for photogrammetry and remote sensing:A review
[J].DOI:10.1016/j.isprsjprs.2014.02.013 URL [本文引用: 1]
无人机遥感:大众化与拓展应用发展趋势
[J].
UAV remote sensing:Popularization and expand application development trend
[J].
无人机低空航摄的矿山地质灾害精细探测方法
[J].
Precise detection method for mine geological disasters using low-altitude photogrammetry based on unmanned aerial vehicle
[J].
无人机高分辨率遥感影像地震滑坡信息提取方法
[J].
Method of earthquake landslide information extraction based on high resolution unmanned aerial vehicle images
[J].
基于CNN模型的遥感图像复杂场景分类
[J].DOI:10.6046/gtzyyg.2018.04.08 [本文引用: 1]
Complex scene classification of remote sensing images based on CNN
[J].DOI:10.6046/gtzyyg.2018.04.08 [本文引用: 1]
高分辨率遥感影像提取城市土地覆盖信息的决策树优化研究
[J].
Research on decision tree optimization for extracting urban land cover information from high-resolution remote sensing images
[J].
基于机器学习的地物图像分类方法研究
[D].
Research on ground object image classification method based on machine learning
[D].
Automatic landslide detection from remote-sensing imagery using a scene classification method based on BoVW and pLSA
[J].DOI:10.1080/01431161.2012.705443 URL [本文引用: 1]
Seasonal landslide mapping and estimation of landslide mobilization rates using aerial and satellite images
[J].DOI:10.1016/j.geomorph.2011.01.013 URL [本文引用: 1]
基于蜂群K-means算法的遥感图像聚类应用研究
[J].
Research on remote sensing image clustering based on bee colony K-means algorithm
[J].
Some methods for classification and analysis of multivariate observation
[C]//
Candidate groups search for K-harmonic means data clustering
[J].DOI:10.1016/j.apm.2013.05.052 URL [本文引用: 1]
K-Means聚类算法研究综述
[J].
Survey on K-means clustering algorithm
[J].
Review:Study on simple k mean and modified K mean clustering technique
[J].
基于K-means聚类算法的改进
[J].
Improvement of clustering algorithm based on K-means
[J].
k均值聚类引导的遥感影像多尺度分割优化方法
[J].
Optimization approach for multi-scale segmentation of remotely sensed imagery under k-means clustering guidance
[J].
基于谱聚类的多数据流演化事件挖掘
[J].
Mining evolutionary events from multi-streams based on spectral clustering
[J].
不等长时间序列滑窗STS距离聚类算法
[J].
Non-equal time series clustering algorithm with sliding window STS distance
[J].
/
〈 |
|
〉 |
