河南省信阳市浉河区自然资源智能化信息提取技术方法研究
Method research of intelligentized extraction of natural resources information from Shihe District,Xinyang City,Henan Province
责任编辑: 张 仙
收稿日期: 2019-11-29 修回日期: 2020-06-15 网络出版日期: 2020-12-15
基金资助: |
|
Received: 2019-11-29 Revised: 2020-06-15 Online: 2020-12-15
作者简介 About authors
王跃峰(1963-),男,教授级高级工程师,主要从事自然资源遥感调查方面的研究。Email:
基于“简译”图像处理软件,利用北京二号卫星遥感数据,采用“面向对象+深度学习”的方式,在河南省信阳市浉河区约200 km2试验区对林地、水稻田、茶园、水体、建设用地等进行了智能化信息提取和准确的自动化分类。林地、茶园和水稻田采用比值植被指数,结合边界指数阈值特征值实时筛选等方法进行智能化分类,水体采用绿光波段与近红外波段的归一化比值指数进行智能化提取,建设用地利用第1波段的标准差作为特征值进行提取。试验区各地类信息智能化提取结果经实地调查验证准确率达90%以上,相较传统人工方法工作效率提高了19倍。实验研究表明,“简译”图像处理软件技术方法可靠,解译精度高,效果事半功倍,社会经济效益显著,在自然资源及环境智能化遥感解译中有比较好的推广应用价值。
关键词:
Based on “Easy Interpretation” image processing software and using BJ-2 satellite remote sensing images, the method of “object-oriented+deep learning” was introduced into the intelligent information extraction and automatic classification of the 200 km 2 test plot in Shihe District, Xinyang City, which included forestland, tea garden, paddy land, water area, construction land and some other land. By the method of ratio vegetation index (RVI) in combination with the real-time selection of the boundary index threshold and eigenvalues, the forestland, tea garden and paddy land information of the test plot was classified intelligently. The water area information was extracted intelligently by the green and near-infrared band normalized difference vegetation index (NDVI). The information of construction land was extracted by using standard deviation of band1 as the eigenvalues. Based on the above methods and field geological survey, the results show that the intelligent information extraction in the test plot has a high accuracy of over 90%. The efficiency is 19 times higher than the traditional method. The study shows that “Easy Interpretation” image processing software is effective and highly accurate and can do half the work with twice the results, which has good value for extension and application in the intelligentized interpretation of natural resources and environment.
Keywords:
本文引用格式
王跃峰, 武慧智, 何姝珺, 黄頔, 白朝军.
WANG Yuefeng, WU Huizhi, HE Shujun, HUANG Di, BAI Chaojun.
0 引言
近几年来,随着人工智能、大数据等高新技术的快速发展,利用新型图像处理软件或传统软件研发的深度学习新模块开展耕地、林地[1]、草地、地表水、园地、建设用地等自然资源遥感智能化解译成为一种趋势。笔者在主持开展“河南省自然资源全时空动态监测及信息资源采集关键技术研究”项目中,利用北京治元景行科技有限公司研发的“简译”(Easy Interpretation)图像处理软件,在信阳市浉河区约200 km2试验区范围内,对林地、茶园、水稻田、水体、建设用地等进行了智能化信息提取技术方法探索和研究。
目前,遥感数字图像处理常用的软件类型较多,主要有ERDAS,PCI和ENVI等,它们的主要优点是友好、灵活的用户界面和操作方式,具有图像数据的输入/输出、图像定标、图像增强、正射校正、数据融合以及各种变换、信息提取、图像分类、DEM及地形信息提取、雷达数据提取、三维立体显示分析等功能,在自然资源遥感解译和信息提取中发挥了主力军的作用[2]。但也存在着一些不足,一是对于地物分类,多采用面向对象监督分类的方式,无法准确地定义地物; 二是只能设置单一分割尺度进行单个界面操作; 三是分类完成后,分类结果只能导出到ArcGIS软件中进行修改编辑[3]。而“简译”软件克服了上述软件的诸多缺点,可以进行多尺度分割、多尺度融合、多尺度自由切换。其主要优势具有同时提供3个分割尺度实现对不同大小地物边界的准确分割; 具有独有的“面向对象+深度学习”的分类方法,通过模型训练,让机器掌握不同对象的纹理、环境等高级语义特性,最大程度上实现软件的自动化分类,同时提高整体的分类精度; 可以提供软件内部的编辑功能,可对分类结果进行单个图斑或者批量图斑编辑修改等。“简译”软件与其他常规软件相比,具有较大的先进性,可以大大提高遥感智能化解译的精度和工作效率。
1 试验区概况及影像特征
1.1 试验区概况
信阳市浉河区位于河南省南部、信阳市西部,是河南省的南大门。浉河区东部与罗山县、平桥区近邻,南与湖北的应山县、大悟县接壤,西接湖北省随州市(图1)。
图1
图1
浉河区北京二号B3(R),B2(G),B1(B)合成影像及试验区位置
Fig.1
BJ-2 B3(R),B2(G),B1(B) image of Shihe District and the location of test area
该区总面积为1 783 km2,辖8个乡镇8个办事处,2018年底总人口为66.49万人,是信阳市委、市政府所在地和信阳毛尖的核心产地。浉河区呈西南高、东北低的缓倾地形,西部和南部是大别山区,东部和北部为淮河冲积平原,最高海拔为906 m,最低海拔为54 m,坡度一般在35°以上,坡陡山高。地表植被和水系发育,植被以乔木林和人工种植的茶园为主,耕地类型主要为水稻田; 地表水除有南湾水库外,还发育大量坑塘,区内自然资源丰富。
试验区位于信阳市浉河区西部的董家河镇一带,地理坐标在E113°45'40″~113°53'01″,N32°02'41″~32°14'29″之间,面积约200 km2。地形呈南高北低之势,北部地形相对平坦,为淮河冲积平原,地表地物类型主要有水稻田、水体和建设用地等; 中南部为丘陵山地,相对高差为20~250 m,地表地物类型主要有林地、茶园、水体和少量草地。在试验区的南北2处各选择10 km2的区域作为野外验证区,来验证智能化提取的精度。
1.2 试验区主要地类遥感影像特征
本次工作采用2015年7月11日在印度成功发射的北京二号卫星数据,由3个可见光和1个近红外波段组成,全色波段空间分辨率为0.8 m,多光谱波段空间分辨率为3.2 m。影像波段组合为B3(R),B2(G),B1(B),时相为2016年7月。试验区地表主要地物类型有林地、水稻田、茶园、水体和建设用地等,在北京二号B3(R),B2(G),B1(B)合成影像上呈现不同的特征(图2)。
图2
图2
试验区不同地物在北京二号B3(R),B2(G),B1(B)合成影像上的特征
Fig.2
True color images composed of BJ-2 B3(R),B2(G),B1(B) of different features in test plot
2 面向对象+深度学习信息提取技术
2.1 面向对象+深度学习地物提取技术流程
“简译”软件采用面向对象+深度学习的方式,通过将2种方法的优势进行结合,从而更加准确地自动化分类。主要技术流程如图3所示。
图3
1)加载原始数据,按照默认分割尺度对影像进行多尺度分割。
2)分割完成后,在数据分类界面首先建立分类体系,即在该影像中确定提取的地物类别。点击新增按钮,建立林地、水体、建筑物、水稻、茶园等地物类别; 建好类别后,可改变颜色填充效果或者透明度等符号显示,以便后续查看与编辑。
3)选取样本区域并对样本区分类解译。在影像中选择一块或者多块样本区,准则是在样本区域内可包含各类地物的各种不同的地物特征,以保证样本区域的完整性、丰富性。
4)深度学习模型训练。使用“简译”软件内置的深度学习提取模型,样本区正确定义完成后,利用前一步选取的样本训练深度学习模型。
5)分类提取。深度学习模型训练完成后,可在深度学习提取模型界面点击精确分类,从而完成目标地类的地物提取。提取完一类后进行查验确定该类别提取是否准确,再进行下一类提取。
6)矢量平滑导出。完成分类解译后,对各类别进行矢量平滑导出。“简译”软件支持选择对象单独导出、合并对象导出等不同的模式,可分类别(林地、水体、建筑物)导出不同的矢量,也可全选导出为一个矢量文件。设置平滑因子与压缩因子,可消除像素级锯齿效应,平滑出媲美人工解译的效果。
2.2 面向对象+深度学习多尺度分割提取理论技术
2.2.1 面向对象多尺度分割理论技术
面向对象的分类以对象(或图斑)所表现出的整体性质作为区分地物的依据,具有2个重要的特征: 一是充分利用对象信息(色调、形状、纹理、层次)和类间信息(与邻近对象、子对象、父对象的相关特征); 二是能够利用多尺度信息,得到多尺度的分割结果,形成不同分辨率等级的图斑,所有地物类别并不是在同一尺度的影像中进行提取,而是在其最适宜的尺度层中提取。
基本思想是: 从一个单个像元开始,分别与其邻近像元进行计算,以降低最终结果的异质性,当一轮合并结束后,以上一轮生成的对象为基本单元,继续分别与它的相邻对象进行计算。这一过程将一直持续到在用户指定的尺度上已经不能再进行任何对象的合并为止。这种异质性是由2个对象的光谱和形状差异决定的。这种差异性度量准则的计算公式为:
式中:
式中:
2.2.2 深度学习地物提取理论技术
深度学习的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像、声音和文本。经典的神经网络模型一般包括3层: 输入层、隐藏层和输出层,它们只有相邻层节点之间有连接,同一层以及跨层节点之间相互无连接,每一层可以看作是一个逻辑回归模型; 这种分层结构,是比较接近人类大脑结构的, 所以一般深度学习模型也叫作深度神经网络模型。相对于传统方法,深度学习在图像识别领域取得巨大进步的主要原因在于深度神经网络具有实现自动特征筛选及提取的功能。
2.3 构建区内主要地类提取规则库
2.3.1 提取林地、水稻田、茶园等植被的特征规则
提取植被通常有2个参数: 比值植被指数(ratio vegetation index,RVI)和归一化差值植被指数[4](normalized difference vegetation index,NDVI)。由于可见光的红光波段(R)与近红外波段(NIR)对绿色植物的光谱响应十分不同,所以,两者简单的数值比能充分表达2个反射率之间的差异。
RVI表达式为:
式中: ρNIR和ρR分别为红光和近红外波段反射率。RVI是绿色植物的一个灵敏的指示参数,它与叶面积指数、叶干生物量、叶绿素含量相关性较高,被广泛用于估算和监测绿色植物生物量。在植被高密度覆盖情况下,它对植被十分敏感,与生物量的相关性最好。但当植被覆盖度小于50%时,它的分辨能力显著下降。此外,RVI对大气状况很敏感,大气效应大大地降低了它对植被检测的灵敏度,本文利用经大气校正的数据,将2个波段的灰度值转换成反射率后再计算RVI,以消除大气对2个波段不同非线性衰减的影响。
NDVI的表达式为:
实际上,NDVI是简单比值RVI经非线性的归一化处理所得。
在植被遥感中,NDVI的应用最为广泛[5]。它是植被生长状态及植被覆盖度的最佳指示因子,与植被分布密度呈线性相关。因此又被认为是反映生物量和植被监测的指标。采用NDVI公式调整参数,得到对应的植被区域。
图4
图4
地表植被智能化提取北京二号B3(R),B2(G),B1(B)合成影像分割图
Fig.4
Segmentation image of vegetation extraction for BJ-2 B3(R),B2(G),B1(B) image
图5
图6
图7
2.3.2 提取水体的特征规则
图8
水体指数表达式为:
式中ρG为绿光波段反射率。本文自定义NDWI水体特征,即(ρG-ρNIR)/(ρG+ρNIR),软件对所有的对象计算了自定义特征的特征值,并做了相关统计,其中最小值为-0.39、最大值为0.16、均值为0.02、方差为0.15。最后点击应用按钮,就能快速准确地采用该特征值提取水体。
2.3.3 提取建设用地特征规则
图9
3 智能化信息提取结果及效益分析
3.1 智能化信息提取结果及验证
该试验区智能化信息提取总面积为213.33 km2,共解译林地、茶园、水稻田、水体和建设用地等各类图斑19 461个(表1)。其中林地图斑面积最大,达144.02 km2,占总面积的67.51%; 建设用地图斑个数最多达10 414个,占图斑总数的53.51%,本次智能化提取结果验证样本区南、北各选择一块,每块约10 km2,总计约20 km2(见图1)。对每一个验证区进行了实地调查验证,结合人工判别,在1∶5 000的精度下,对智能化勾绘图斑的错漏、精度等进行了检查统计,验证结果如表2和表3。验证结果表明: 建设用地解译正确率相对较高,南、北2区正确率分别达93.73%和97.80%; 水体正确率相对较低,南、北2区正确率分别达86.96%和91.82%。南、北验证区平均正确率分别为92.75%和95.12%。试验区智能化遥感解译验证图斑总数为2 047个,错误图斑总数为114个,正确率为94.43%。
表1 智能化信息提取统计
Tab.1
序号 | 类别 | 图斑数/个 | 数量占比/% | 面积/km2 | 面积占比/% | |
---|---|---|---|---|---|---|
1 | 林地 | 2 281 | 11.72 | 144.02 | 67.51 | |
2 | 茶园 | 4 124 | 21.19 | 37.77 | 17.70 | |
3 | 水稻 | 1 222 | 6.28 | 12.26 | 5.75 | |
4 | 建设用地 | 10 414 | 53.51 | 14.85 | 6.96 | |
5 | 水体 | 1 420 | 7.30 | 4.43 | 2.08 | |
合计 | 19 461 | 100.00 | 213.33 | 100.00 |
表2 南验证区信息提取结果验证统计
Tab.2
序号 | 地类 | 图斑数/个 | 面积/km2 | 错漏数/个 | 勾绘不准确数/个 | 错误占比/% | 正确率% |
---|---|---|---|---|---|---|---|
1 | 茶园 | 212 | 2.07 | 12 | 5 | 8.02 | 91.98 |
2 | 林地 | 39 | 8.31 | 1 | 2 | 7.70 | 92.30 |
3 | 水体 | 23 | 0.02 | 2 | 1 | 13.04 | 86.96 |
4 | 建设用地 | 319 | 0.30 | 14 | 6 | 6.27 | 93.73 |
合计/平均值 | 593 | 10.70 | 29 | 14 | 7.25 | 92.75 |
表3 北验证区信息提取结果验证统计
Tab.3
序号 | 地类 | 图斑数/个 | 面积/km2 | 错漏数/个 | 勾绘不准确数/个 | 错误占比/% | 正确率/% |
---|---|---|---|---|---|---|---|
1 | 水稻田 | 546 | 2.98 | 15 | 25 | 7.33 | 92.67 |
2 | 林地 | 117 | 6.04 | 3 | 4 | 5.98 | 94.02 |
3 | 水体 | 110 | 0.19 | 4 | 5 | 8.18 | 91.82 |
4 | 建设用地 | 681 | 1.44 | 5 | 10 | 2.20 | 97.80 |
合计/平均值 | 1 454 | 10.65 | 27 | 44 | 4.88 | 95.12 |
3.2 工作效益分析
基于“简译”图像处理软件,采用本文方法对试验区林地、水稻田、茶园、水体和建设用地等地物类型进行智能化信息提取及1∶5 000制图,从图像处理到后期处理编绘,1个工作人员工作时间仅不到2 d,正确率保持在90%以上。而若采用传统人工方式进行信息提取工作,要想保持同样精准度,1个工作人员最短时间也要在40 d以上。即采用“简译”图像处理软件可以提高19倍的工作效率。
4 结论及展望
“简译”图像处理软件是近几年来在自然资源及环境应用领域发展较好的软件之一。它提供了遥感影像信息提取全流程自动化的解决方案,能够“一键式”完成遥感影像的分类和信息提取等复杂工作,实现了遥感影像原始数据的全自动预处理和数字正射影像数据生成、深度学习分类方法全流程的高度自动化和无人值守的自动化遥感影像分类及信息提取等功能,对快速解译不同地类和环境信息勾绘精准、正确率高,有较好的推广应用价值。但它仍有对某些地物难以准确区分等疑难复杂问题需要克服,在应用中也需要配合更多不同种类的遥感信息进行综合研究和详细划分。这也是今后各类图像处理软件在自然资源精细化、智能化解译方面所要解决的关键技术问题和难点。
参考文献
基于GF-1 WFV数据森林叶面积指数估算
[J].
Estimation of forest leaf area index based on GF-1 WFV data
[J].
中国高分辨率对地观测系统重大专项建设进展
[J].
Development of China high-resolution earth observation system
[J].
高分辨率对地观测的若干前沿科学问题
[J].
Current issues in high-resolution Earth observation technology
[J].DOI:10.1360/zd-2012-42-6-805 URL [本文引用: 1]
基于归一化指数分析的居民地遥感信息提取
[J].
Extracting remote sensing information of residential areas based on the analysis of normalized difference index
[J].
一种利用TM图像自动提取城镇用地信息的有效方法
[J].
An effective approach to automatically extract urban land-use from TM imagery
[J].
高分辨率遥感影像面向对象分类方法研究
[D].
Study on object-based classification of high-resolution remote sensing imagery
[D].
高分辨率影像解译理论与应用方法中的一些研究问题
[J].
Interpretation theory and application method development for information extraction from high resolution remotely sensed data
[J].
高分辨率遥感影像信息提取与目标识别技术研究
[J].
Research on information extraction and target recognition fromhigh resolution remote sensing image
[J].
最新光学高分辨率卫星遥感技术及其应用研究
[D].
A study on state-of-art optical high resolution remote sensing satellite technology and its application
[D].
高分辨率遥感图像分类技术研究
[D].
Research on high resolution remote sensing image classification technology
[D].
高分辨率遥感特征基元提取与格局判别方法研究
[D].
Study of parcel unit extraction based-on features and pattern distinguishment from high spatial resolution remote sensing images
[D].
高分辨率遥感影像特征分割及算法评价分析
[J].
Research on high resolution remote sensing image segmentation methods based on features and evaluation of algorithms
[J].Image segmentation is a key technique in image processing and computer vision field. From the point of view of geo-processing and application of remote sensing images, this paper emphasizes the importance of image segmentation for information extraction and targets recognition from remote sensing images and sets a classification system of common remote sensing image segmentation methods. In addition, this paper states the thoughts of high resolution RS image segmentation methods evaluation and tests it by evaluating four typical image segmentation algorithms based on features with six images qualitatively and quantitatively. The four typical image segmentation algorithms are Max-Entropy (ME), Split&Merge (SM), improved Gauss Markov Random Field(GMRF) and Orientation&Phase(OP). In the qualitative evaluation, this paper analyses these algorithms in terms of their rationale and gets a rough evaluation. In the quantitative evaluation, image complexity is taken into account firstly and five measures are employed. The five measures are removed region rumber, non uniformity within region measure, contrast across region measure, variance contrast across region measure and edge gradient measure. The qualitatively and quantitatively evaluation results are important to perform the optimal selection of segmentation algorithm in practical work. In the end, this paper draws some conclusions about high resolution remote sensing image segmentation and enumerates the flaws of image segmentation methods evaluation, especially it concludes the application prospect of high resolution RS image segmentation.
/
〈 |
|
〉 |
