国土资源遥感, 2018, 30(2): 87-92 doi: 10.6046/gtzyyg.2018.02.12



何雪,, 邹峥嵘, 张云生, 杜守基, 郑特

中南大学地球科学与信息物理学院,长沙 410083

Object-oriented classification method for oblique photogrammetric point clouds

HE Xue,, ZOU Zhengrong, ZHANG Yunsheng, DU Shouji, ZHENG Te

School of Geosciences and Info-Physics,Central South University, Changsha 410083, China


第一作者: 何 雪(1994-),女,硕士研究生,主要从事数字摄影测量方面的研究。Email: csuhx_snow@163.com

收稿日期: 2016-09-20   修回日期: 2016-11-28   网络出版日期: 2018-06-15

基金资助: 卫星测绘技术与应用国家测绘地理信息局重点实验室开放基金项目“卫星影像与稀疏三维点联合高精度处理方法研究”.  编号: KLSMTA-201505
国家重点基础研究发展计划资助项目(“973”计划)“高分辨率遥感影像的目标特征描述与数学建模”.  编号: 2012CB719903
国家自然科学基金项目“自适应三角形约束的多角度影像多基元匹配方法”.  编号: 41201472
水能资源利用关键技术湖南省重点实验室开放基金项目“近景摄影测量库岸滑坡监测关键技术研究”.  编号: PKLHD201310

Received: 2016-09-20   Revised: 2016-11-28   Online: 2018-06-15

Fund supported: .  编号: KLSMTA-201505
.  编号: 2012CB719903
.  编号: 41201472
.  编号: PKLHD201310


随着影像密集匹配方法的发展,目前可以从多视倾斜航空影像获得大量类比于激光扫描数据密度甚至精度的点云,但获取结果以着色的点云为主,缺乏分类信息。针对此问题,提出了一种面向对象的倾斜摄影测量点云分类方法。首先,计算单点特征向量; 然后,利用SLIC(simple linear iterative clustering)算法将点云对应的影像分割成超像素,再根据点云和影像间的关系,将点云聚类成超体素对象,并计算每个对象的特征向量; 在此基础上,采用随机森林算法对超体素进行分类; 最后,根据语义信息对分类结果进行后处理获得最终的点云分类结果。2组典型实验数据结果表明,总体分类精度分别达到91.2%和88.1%,比基于单点的分类方法分别提高了2.3%和8.2%。

关键词: 点云分类 ; 点云特征 ; 倾斜影像 ; 面向对象 ; 随机森林


With the development of image dense matching method, point clouds can be obtained from multi-view oblique aerial images, whose accuracy and density can be comparable with LiDAR point clouds. However, the currently derived colored point clouds lack classification information. In view of such a situation, this paper proposes an object-based classification method for oblique photogrammetric point clouds. The first step of this method is to calculate features of each point. Then, SLIC algorithm is used to divide the corresponding image into super-pixels. After that, point clouds are clustered into super-voxels as objects according to the relationship between point clouds and images, and features of each object are calculated afterwards. Random forests algorithm is used to classify these super-voxels. Finally, contextual information is adopted to optimize the initial classification results. Two sets of data were employed for evaluating the proposed method, and the overall accuracy could reach up to 91.2% and 88.1% respectively, which improves the precision by 2.3% and 8.2% compared with the point-based classification.

Keywords: point clouds classification ; features of point clouds ; oblique image ; object-oriented ; random forests

0 引言


目前,针对激光点云分类的方法较多,Gerke等[5]采用图割算法,综合归一化高度、法向量的Z分量、影像上线段长度、颜色和纹理等特征将LiDAR点云分成建筑物、树木、草地和地面4类; Guan等[6]采用随机森林分类方法,综合基于光谱的特征、基于LiDAR的几何特征以及强度特征将LiDAR点云分成建筑物、树木、地面和草地4类; Xu等[4]通过点、平面和均值漂移3方面的特征对LiDAR点云进行分类,并比较了AdaBoost、随机森林、ANN_MLP(artificial neural networks multiple layer perceptrons)、支持向量机(support vector machine,SVM)和Rule-based这5种分类器的分类效果; 徐宏根等[7]根据三角网坡度信息熵,利用面向对象的方式对LiDAR点云的植被和建筑物进行区分。然而,和倾斜航空摄影技术相比,激光扫描技术获得建筑物立面的点较少,故倾斜摄影测量点云的应用[8,9,10]具有广泛的需求。目前针对摄影测量点云的分类较少,比较有代表性的包括: Rau等[11]提出基于规则的层次语义面向对象分类方法,综合几何、光谱和拓扑特征将倾斜摄影测量点云分类成树木、草地、立面、屋顶和道路5类,该方法需要较多的阈值; Gerke等[12]比较了监督分类和非监督分类2类方法在倾斜摄影测量点云分类上的应用效果,但主要针对比较简单的场景。

综上,本文提出一种面向对象的倾斜摄影测量点云监督分类方法。由于在监督分类方法中,随机森林算法和SVM分类精度相当[13],且在计算效率、对异常值和噪声的鲁棒性、内部误差估计和变量重要性等方面具有优越性[6],因此本文采用随机森林分类器进行分类。根据目标对象的颜色和几何等特征将点云分成屋顶、地面、植被和立面4类。本文方法流程如图1 所示。


图1   本文方法流程

Fig.1   Overview flowchart of the method in this paper

1 分类方法

1.1 点云特征计算


1)法向量nx,nynz。每一点的法向量定义为对其k (本文取 k=8) 邻域内的点进行最小二乘拟合得到的平面法向量。


3)归一化高程Nz。本文利用文献[14]方法分离地面点并内插得到数字地形模型(digital terrain model,DTM),然后每一点减去DTM的对应高度以获取归一化高度。


Gr= GR+G+B。 (1)


ax+by+cz+d=0 , (2)

式中: x,yz为点的坐标; a,b,cd为平面拟合方程的参数。那么,fv定义为

fv(pi)= c, (3)



fp(pi)= e-j=1ndjn, (4)

式中: n为邻域点数; dj为第j个邻域点到平面的距离。计算平面拟合度时,利用一定邻域内的点拟合一个平面,然后计算所有拟合该平面的点到该平面距离的负数指数幂作为fpfp的取值范围为(0,1),局部邻域越接近于平面,fp的值越小。

1.2 对象分割与特征计算

本文采用的点云为SURE软件[15]生成的密集点云,每一张影像对应一个点云文件。并采用间接的方法获得点云对象,即首先利用简单线性迭代聚类(simple linear iterative clustering,SLIC)算法将点云对应的影像分割成超像素,该算法仅需要指定超像素的数量m[16]; 然后,利用共线方程将点云投影到影像上; 再根据超像素分割的结果将点云聚类成不同的超体素,作为本文分类的对象。在获取了点云对象之后,根据对象中所包含的单点的特征向量,采用式(5)计算对象的特征向量,即

fo= l=1NflN, (5)

式中: fo表示对象的特征向量; fl表示第l个单点的特征向量; N表示一个对象中包含的单点数量。

1.3 随机森林算法

随机森林算法由Breiman 于2001年提出[17]。该算法的基本思想是用随机的方式建立一个森林,森林中含有很多决策树,每一棵树都是二叉树的形式。在生成森林之后,当输入新的样本时,每棵决策树便会对其进行判断,然后根据所有的判断结果选出票数最多的作为最终的分类结果[18]


1.4 后处理优化

初始分类结果中不可避免地存在错误分类,因此本文进一步利用上下文关系对初始分类结果进行优化。首先,对分类结果进行联通分析,将具有邻接关系的同类点云聚成簇; 然后,根据上下文关系对其进行优化处理,具体包括以下3个规则: ①对于屋顶簇,如果屋顶周围没有立面,则认为该屋顶是错分的,根据其邻域中所占比例最高的类别来修正其类别; ②对于地面簇,如果地面的周围只有屋顶,则将该地面修正为屋顶; ③对于立面簇,如果立面周围没有屋顶,则该立面是错分的,根据其邻域中所占比例最高的类别来修正其类别。

2 实验与分析

2.1 数据准备

为了验证本文方法,采用了如图2所示的2组数据进行实验。该点云(如图2(a)和(d)所示)均由SWDC-5影像生成,密度约为20~30 pt/m2图2(b)和(e)分别为彩色点云对应的原始影像,图2(c)和(f)分别为将点云投影到原始影像上的叠加效果,从图2(c)和(f)可以看出点云并没有完全覆盖原始影像,所以当影像分割成一定的超像素时,实际需要分类的对象数量小于该数值。本文参考数据由人工在原始影像上进行标注,精度评定时,将分类后的点云投影到原始影像上,与参考数据进行对比计算精度。


图2   数据源

Fig.2   Data sources

由于对象的数量对分类结果有较大的影响,分别测试了m取80 000,100 000和150 000时的分类效果。表1为每组数据的训练集、测试集和总体数据的点云对象数量。

Tab.1   Experimental datasets(个)

第1组80 00039 09711110753111440426210441
100 00048 00213612962133543515247531
150 00069 50419518386184776728340736
第2组80 00041 58662525548245205218192
100 00051 60673636557292250256227
150 00076 218104889580415352378316

2.2 分类器训练结果


表2   分类器训练结果

Tab.2  Learning results of classifier

m=80 000m=100 000m=150 000m=80 000m=100 000m=150 000
Kappa系数0.963 20.986 60.977 20.978 20.979 10.969 8

表2可以看出,2组数据均在m=100 000时取得最佳分类结果。



图3   数据特征重要性

Fig.3   Importance of datasets features

图3可以看出nz,Nz,fv,Gr以及颜色特征对于分类具有重要作用,nx,nyfp作用相对较小; 当m取值不同时,各个特征的重要性基本一致。

2.3 总体数据分类实验结果

根据2.2节结果,本文采用m=100 000时训练的随机森林分类器对总体数据进行分类,然后对初始分类结果进行优化。结果可视化效果如图4所示。


图4   分类结果可视化

Fig.4   Visualization for classification results



表3   总体分类精度

Tab.3  Overall accuracy(%)


2.4 误差分析

分类误差主要包括以下2种情况: ①参考数据中,地面上的物体被标注为地面(例如汽车),因此会导致存在一些错分的对象,如图5(a)所示,车顶为绿色的汽车被分类为植被; ②由于阴影的存在和样本选择的不适当会导致一些区域错误地分成植被,如图5(b)所示。


图5   错误分类示例

Fig.5   Examples of error classification

3 结论


本文方法仍存在一些不足之处。首先,需要挖掘更多更有效的特征来提高分类精度; 其次,摄影测量点云的质量对分类结果有很大的影响,因此,开发更好的立体影像密集匹配算法会进一步提高分类精度; 最后,选取样本时应更加全面,例如不同建筑物的屋顶颜色和高度会差异很大,因此需要尽量多选择不同种类的屋顶。


