国土资源遥感, 2018, 30(4): 49-55 doi: 10.6046/gtzyyg.2018.04.08

基于CNN模型的遥感图像复杂场景分类

张康1,2,3, 黑保琴1,2, 李盛阳1,2, 邵雨阳1,2

1. 中国科学院空间应用工程与技术中心,北京 100094

2. 中国科学院太空应用重点实验室,北京 100094

3. 中国科学院大学,北京 100049

Complex scene classification of remote sensing images based on CNN

ZHANG Kang1,2,3, HEI Baoqin1,2, LI Shengyang1,2, SHAO Yuyang1,2

1. Technology and Engineering Center for Space Utilization, Chinese Academy of Sciences, Beijing 100094, China

2. Key Laboratory of Space Utilization, Chinese Academy of Sciences, Beijing 100094, China

3. University of Chinese Academy of Sciences, Beijing 100049, China

责任编辑: 李瑜

收稿日期: 2017-04-11   修回日期: 2017-05-14   网络出版日期: 2018-12-15

基金资助: 中国科学院空间应用工程与技术中心前瞻性课题“基于深度学习的高分辨率遥感影像农作物识别方法研究”资助.  CSU-QZKT-201713

Received: 2017-04-11   Revised: 2017-05-14   Online: 2018-12-15

作者简介 About authors

张康(1992-),女,硕士研究生,主要研究方向为机器学习、遥感图像处理。Email:zhangkang1128@126.com。 。

摘要

复杂场景分类对于挖掘遥感图像中的价值信息具有重要意义。针对于遥感图像的复杂场景分类,提出了一种基于卷积神经网络(convolutional neural network,CNN)模型的分类方法,在该方法中构建了8层CNN网络结构,并对输入图像进行预处理操作以进一步增强模型的适应性,且在模型分类器的选择问题上提供了Softmax和支持向量机2种分类器,使其能够自动化提取特征,避免了前期繁琐的图像处理和人工提取特征等过程。在UC Merced Land Use和Google of SIRI-WHU这2组数据集中进行实验,结果表明,相比于CNN with Overfeat feature和SRSCNN方法,该模型提高了2%以上的分类精度,且2种分类器的总体分类精度均能达到95%以上。

关键词: 卷积神经网络 ; 深度学习 ; 遥感图像 ; 场景分类 ; 支持向量机

Abstract

Complex scene classification has great significance for mining the value information in remote sensing images. The proposed convolutional neural networks (CNN) can improve the complex scene classification of remote sensing images. The CNN method extracts features automatically, avoiding problems in the image pretreatment and the feature extraction by manual labor. An eight-layer CNN model is constructed in this paper, and the pre-treatment module has enhanced the adaptability of this method. Given the problem in choosing classifiers, this paper provides the Softmax and support vector machine (SVM) in the presented CNN. The experiment results in two datasets, the UC Merced Land Use and the Google of SIRI-WHU indicate that the presented CNN method can increase the accuracy of classification by more than 2% compared with the CNN with Overfeat feature method and the SRSCNN method, and the total classification accuracy of the two classifiers is over 95%.

Keywords: convolutional neutral networks ; deep learning ; remote sensing images ; scene classification ; support vector machine

PDF (4541KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

张康, 黑保琴, 李盛阳, 邵雨阳. 基于CNN模型的遥感图像复杂场景分类. 国土资源遥感[J], 2018, 30(4): 49-55 doi:10.6046/gtzyyg.2018.04.08

ZHANG Kang, HEI Baoqin, LI Shengyang, SHAO Yuyang. Complex scene classification of remote sensing images based on CNN. REMOTE SENSING FOR LAND & RESOURCES[J], 2018, 30(4): 49-55 doi:10.6046/gtzyyg.2018.04.08

0 引言

随着对地观测技术的迅速发展,遥感图像的数据量显著增加,大量堆积的遥感图像中所蕴含的有价值信息亟待充分挖掘和利用。遥感图像的复杂场景识别和分类是提取并分析这些信息的重要内容之一,它能够广泛应用于土地利用[1]、全球环境污染监测[2]和军事领域目标检测[3]等方面,具有重要的理论意义和实践价值[4]。传统的遥感图像场景分类方法,例如贝叶斯模型和k-均值[5]等方法,都有一定的应用限制,通常要求样本足够大并且样本数据服从正态分布,才能得到较为理想的分类结果[6]。此外,虽然之后的支持向量机(support vector machine,SVM)方法在遥感图像识别与分类任务中取得了较优的效果[7,8],但其本质上属于浅层的结构模型,计算单元有限,难以有效地表达复杂函数,对于复杂的分类问题其泛化能力仍不足[9,10]

为了克服浅层学习模型以及人工提取特征所带来的问题,Hinton等[11]于2006年提出了深度学习的概念。以卷积神经网络(convolutional neural net-work,CNN)为代表的深度学习方法,主要是用于识别二维形状而特别设计的一种多层感知器。CNN模型的卷积层可以实现自动化的图像特征提取,从而避免过多的人为干涉,同时其局部连接、权值共享等技术能够有效地减少网络参数,从而降低网络模型的计算量并提升模型的泛化能力[9]。目前,利用CNN模型在遥感图像领域已经取得了一定的研究成果,例如行人检测[12]、火灾识别[13]、船舰检测[14]等领域,但是对于遥感图像的复杂场景分类应用仍然较少。本文提出了一种基于CNN模型的遥感图像复杂场景分类方法,并在UC Merced Land Use和Google of SIRI-WHU这2组数据集中进行实验。由于上述2组通用数据集的样本量不是很大,为了提高小样本数据下的分类精度,本文采用对CNN中典型的AlexNet[15]模型进行预训练的方法来提取多尺度图像特征; 为了使模型适应不同大小的遥感图像,模型前增加了预处理模块,该模块通过改变步长和随机裁剪尺寸的方式来获取最大图像输入,从而保证了滤波器的不变性,有利于特征提取; 为了横向比较分类器的选择问题,在模型中采用了Softmax和SVM这2种分类器。

1 遥感图像复杂场景分类的CNN模型

遥感图像场景分类的核心在于图像特征的有效提取。相比于传统的特征提取方法(例如局部二值模式、尺度不变特征变换、梯度方向直方图和Gabor滤波器等方法),CNN具有旋转、平移、缩放不变性,并能够提取更加丰富的高层特征信息,充分地降低图像低层视觉特征与高层语义之间的“鸿沟”[16]

基于CNN模型的遥感图像复杂场景分类的总体流程如图1所示。

图1

图1   基于CNN模型的遥感图像场景分类总体流程

Fig.1   Overall flow chart of scene classification for remote sensing images based on CNN


本文构建了一个用于遥感图像复杂场景分类的CNN模型框架,如图2所示。该框架包括5个卷积层(C1—C5),3个池化层(S1—S3),以及一个由全连接层fc6,fc7和Softmax组成的神经网络。其中采用ReLu(rectified linear units)函数作为神经元的激活函数,以解决使用传统的Sigmoid及Tanh等激活函数易出现梯度弥散等问题。

图2

图2   遥感图像场景分类的CNN框架

Fig.2   CNN model for scene classification of remote sensing images


图2中的Ci层为卷积层,相当于一个滤波器,该层的输入特征与卷积核进行卷积操作,然后通过一个激活函数就可以计算出输出特征。卷积层的计算公式为

Xjl=fiMjXil-1kijl+bjl

式中: l为层数; Xil为输出特征; Xil-1为输入特征; Mj为输入特征的集合; kijl为卷积核; bjl为偏置项; 为卷积操作; f(·)为激活函数。

Si层为池化层,又称下采样层,主要用于将特征映射为一个平面。如公式(2)所示,它对公式(1)的计算结果进行下采样操作,并且加上权重和偏置项,最后通过激活函数获得了一个缩小的特征映射图,该操作能够减少网络模型参数,从而降低网络复杂性,提高网络的泛化能力,即

Xjl=f[βjl·down(Xjl-1)+bjl]

式中: down(·)为下采样操作; βjl为第l层的第j个特征图的权重。

然后将最后一个特征图(S3)进行光栅化操作,即将一系列的特征图像转换为神经网络所能接收的向量形式。fc6,fc7和Softmax是一个全连接的神经网络,主要是充当分类器的角色,用于对特征进行分类。

将CNN模型应用于UC Merced Land Use图像数据集和Google of SIRI-WHU图像数据集的具体过程如下: 首先第一个卷积层使用96个11×11大小的卷积核对227×227的UC Merced Land Use图像数据集的场景图像进行步长为4的滤波操作,而对173×173的Google of SIRI-WHU图像数据集的场景图像进行步长为3的滤波操作,均生成96个55×55(计算过程: (227-11)/4+1=55和(173-11)/3+1=55)的特征图; 然后对生成的特征图进行核大小为3、步长为2的Max-Pooling操作,产生96个27×27(计算过程: (55-3)/2+1=27)的特征图。第二个卷积层使用256个5×5的卷积核对27×27的特征图进行零填充大小为2、步长为1的滤波操作,产生256个27×27(计算过程: 27+2×2-5+1=27)的特征图; 然后对生成的特征图进行核大小为3、步长为2的Max-Pooling操作,产生256个13×13(计算过程: (27-3)/2+1=13)的特征图。第三个和第四个卷积层均使用384个3×3的卷积核对13×13的特征图进行零填充大小为1、步长为1的滤波操作,产生384个13×13(计算过程: 13+2×1-3+1=13)的特征图。第五个卷积层使用256个3×3的卷积核对13×13的特征图进行零填充大小为1、步长为1的滤波操作,产生256个13×13(计算过程: 13+2×1-3+1=13)的特征图; 然后对生成的特征图进行核大小为3、步长为2的Max-Pooling操作,产生256个6×6(计算过程: (13-3)/2+1=6)的特征图。经过第一个全连接层,产生4 096个神经元,再将经过ReLu激活函数产生的神经元作为第二个全连接层的输入; 第二个全连接层也产生4 096个神经元,同样将ReLu激活函数产生的神经元作为Softmax层的输入,对于UC Merced Land Use图像数据集,最终的输出结果即为21类的概率结果,对于Google of SIRI-WHU图像数据集的输出结果为12类的概率结果。

由于CNN训练需要大量的带有标签的样本数据,而实际中获取如此庞大的遥感图像场景分类的样本数据较为困难,成本也很高。因此,采用迁移学习[17]的方法,将目前世界上最大的图像识别数据库ImageNet[15]学习到的权重作为框架的初始权重,而不是随机确定初始化权重从头开始训练。该方法能有效地解决小样本数据训练模型易产生的过拟合问题,同时能够大大缩减模型训练的时间。CNN模型的训练和分类过程如图3所示。

图3

图3   基于CNN的遥感图像场景分类方法

Fig.3   Scene classification method of remote sensing images based CNN


训练过程中,首先将带标签数据随机分为2类,作为测试数据集和训练数据集,训练数据集输入CNN模型后,经过前向传播(feed forward, FF)得到模型输出,再计算模型输出和实际数据标签的误差,根据误差求导计算梯度,通过反向传播(back propagation, BP)更新网络,如此往复便可训练出优化的CNN模型。在对模型训练的过程中,引入了镜像和随机裁剪方法(通过对每个图像进行旋转,然后随机选取位置裁剪n×n大小作为新的图像数据)来增加样本数据量,以避免过拟合现象。此外,在全连接层采用“dropout”技术随机使隐含层的某些节点的权重不工作,也能有效地防止过拟合,同时很大程度地降低模型的训练时间。在对测试数据集进行分类的过程中,使用基于CNN模型进行遥感图像复杂场景分类的2种策略: ①使用Softmax分类器直接对测试集数据进行分类; ②将Softmax替换为采用基于经典核函数径向基函数(radial basis function,RBF)的SVM分类器,然后使用SVM分类器对CNN模型fc7层的特征进行分类,从而代替CNN模型的输出层。

2 遥感图像场景分类实验

2.1 实验数据集的选取和处理

为了验证CNN模型分类方法的有效性,选用2组数据集进行实验,分别是包含21类场景的UC Merced Land Use图像数据集[18]和包含了12类场景的Google of SIRI-WHU图像数据集[19],如图4图5所示。UC Merced Land Use数据集通过从美国地质调查局的国家地图城市图像中手工获取。该数据集的每类场景包含100幅256像素×256像素的图像,图像的空间分辨率为0.3 m; Google of SIRI-WHU数据集从Google Earth获取,主要覆盖中国的城市地区,由武汉大学的RS_IDEA团队设计建成。该数据集的每类场景包含200幅200像素×200像素的图像,图像的空间分辨率为2 m。在本文的2类实验中,每类场景随机选取80%的图像作为训练数据集,剩余的图像作为测试数据集。

图4

图4   UC Merced Land Use遥感图像数据集

Fig.4   Datasets of UC Merced Land Use remote sensing images


图5

图5   Google of SIRI-WHU遥感图像数据集

Fig.5   Datasets of Google of SIRI-WHU remote sensing images


对于本文所使用的网络模型来说,在图像输入前需要增加预处理模块,以适应不同的图像大小。首先设置模型中第一层的滤波器大小为11×11,卷积特征图C1大小为55。为了使模型在具有通用性的同时有利于特征提取,需要保证滤波器和特征图C1的大小不变。因此对于输入大小为a像素×a像素的图像,预处理模块要使步长x和图像随机裁剪大小y满足关系式y=54x+11(其中y为不大于a的最大值,从而尽可能保留更多图像信息)。所以第一个数据集UC Merced Land Use的图像大小为256像素×256像素,经过预处理模块后的输入为227像素×227像素的随机裁剪图像和步长值为4。Google of SIRI-WHU数据集的图像大小为200像素×200像素,经过预处理模块后的输入为173像素×173像素的随机裁剪图像和步长值为3。

然后设置2个数据集的训练参数如下: ①UC Merced Land Use训练和测试数据集的批量处理大小分别为56和42,测试集迭代次数为10次(测试集数据量420/42),完整训练一次需要迭代30次(1 680/56),因此设置每迭代30次测试一次; ②Google of SIRI-WHU训练和测试数据集的批量处理大小分别为64和48,测试集迭代次数为10次(测试集数据量480/48),完整训练一次需要迭代30次(1 920/64),因此仍然设置每迭代30次测试一次。

2.2 实验结果与分析

2组数据集的分类结果如图6所示。

图6

图6   遥感图像场景分类结果

Fig.6   Classification results of remote sensing images


本文采用CNN+Softmax算法和CNN+SVM算法对UC Merced Land Use和Google of SIRI-WHU2个数据集的遥感图像场景分类的混淆矩阵如图7所示。由图7可以得出以下结论: 整体而言,如图6所示,Google of SIRI-WHU数据集的分类结果要优于UC Merced Land Use数据集。在Google of SIRI-WHU数据集中所有类别的分类精度都达到了90%以上,图7(c)和(d)中也可以看出2种算法对Google of SIRI-WHU数据集分类的各个类别之间的错分率不超过5%; 而UC Merced Land Use数据集中的建筑(类别5)、稠密住宅区(类别7)、高尔夫球场(类别10)和中等住宅区(类别13)等场景的分类精度较差,只能达到80%左右。这主要是因为不同类间的相似性较大(例如UC Merced Land Use数据集中的建筑(buildings)、稠密住宅区(dense residential)和中等住宅区(medium residential)场景,如图8(a)所示),或者相同类之间的差异性大(例如高尔夫球场(golf course),如图8(b)所示)。这一问题根据图7(a)和(b)的混淆矩阵也可以看出。不论是Softmax还是SVM分类器,都能取得很好的分类效果。例如在第一个数据集中的中等住宅区类,使用CNN分类精度为85%,而使用CNN+SVM的分类精度为70%; 然而在建筑类中,使用CNN的分类精度为85%,而使用CNN+SVM的分类精度为90%; 在第二个数据集中,CNN和CNN+SVM的方法对每类的分类精度基本相差不大。因此,Softmax和SVM分类器没有明显优劣之分,可以根据需求针对具体类别选择合适的分类器。尽管2组数据集的分类结果有所不同,同一数据集下不同类别的分类结果也有差别,但总体而言,分类精度还是较高的,基本能保持在90%以上。

图7

图7   基于CNN模型的遥感图像场景分类的混淆矩阵

Fig.7   Confusion matrix of scene classification for remote sensing images based CNN


图8

图8   相似性和差异性

Fig.8   Similarity and difference


为了更好地比较本文提出方法的优势,针对于UC Merced Land Use数据集和Google of SIRI-WHU数据集,表1表2列出了现有的几种其他方法的分类效果。

表1   不同算法UC Merced Land Use数据集的分类精度

Tab.1  Classification accuracy of UC Merced Land Use dataset by different methods(%)

算法测试集精度
BOVW[20,23]72.1±0.4
SPCK++[20,22-23]76.19±0.19
MS-DCNN[21]91.34
CNN with Overfeat feature[23]92.4
CNN+Softmax95.48
CNN+SVM95

新窗口打开| 下载CSV


表2   不同算法Google of SIRI-WHU数据集的分类精度

Tab.2  Classification accuracy of Google of SIRI-WHU dataset by different methods(%)

算法测试集精度
SRSCNN[20]93.40
CNN+Softmax95.63
CNN+SVM95.83

新窗口打开| 下载CSV


表1表2中可以进一步得到以下结论:

1)利用本文提出的方法对UC Merced Land Use数据集进行分类,Softmax和SVM这2种分类器下的分类精度分别高达95.48%和95%,相比于现有的最优方法,精度分别提升了3.08%和2.6%; 而对Google of SIRI-WHU数据集进行分类的精度也分别高达95.63%和95.83%,相比于现有的最优方法,分类精度分别提升了2.23%和2.43%,从而说明本文所提出的方法是十分有效的。

2)结合图6的各类别分类结果可以看出,Softmax和SVM分类器都能得到很好的分类结果,因此在使用CNN模型对遥感图像的场景分类中,可以根据自己需要是否使用SVM替换CNN的Softmax层。

上述分析说明了本文采用的CNN方法的有效性,而图9则展示了2组数据集中训练数据集的损失函数变化曲线和测试数据集的精度变化曲线,其中训练数据集的损失函数变化曲线能够反映出模型的输出结果与实际结果的误差,因此损失函数越小,说明该模型被训练得越好; 测试数据集的精度变化曲线能够反映模型泛化能力的好坏,因此,测试数据集精度越高,说明该模型的泛化能力越好。

图9

图9   精度和损失函数的变化曲线

Fig.9   Curve of accuracy and loss function


图9中可以看出,UC Merced Land Use数据集通过约7 000次迭代后,数据分类精度趋于稳定,并保持在95%以上,而数据集的损失函数也降低至0.005左右,并保持稳定; Google of SIRI-WHU数据集通过约5 000次迭代后,数据分类精度趋于稳定,并保持在95%以上,同时数据集的损失函数也降低至0.000 1左右,并保持稳定。然而,第一组训练数据集的损失函数比第二组的值大,正如图8所描述的原因,第一组数据集中存在类间相似性大以及类内差异性大的数据。即使如此,2组测试数据集的精度都能取得很好的效果,由此可见使用迁移学习的方法在提高时间效率上也具有明显的优势,能有效地降低训练成本,同时仍然保持很好的分类效果。

3 结论

本文提出了一种基于CNN的遥感图像场景分类方法。通过从ImageNet数据集中迁移知识,利用CNN来训练自己的数据集,解决了小样本训练的问题,同时提高了时间效率; 通过增加预处理模块,提升了模型的适应能力; 最后以UC Merced Land Use数据集和Google of SIRI-WHU数据集的实验验证了该方法的有效性。实验结果与现有方法的比较表明,本文方法能够有效地提高遥感图像场景分类的精度。此外,还比较了该模型分别选择Softmax和SVM这2种分类器时的分类精度。2种分类器均能取得很好的分类结果,精度都达到95%以上。因此在使用该CNN模型进行遥感图像的场景分类时,可以选择SVM或Softmax分类器。在后继研究中,可以利用高光谱遥感图像,通过引入更多的光谱信息来替代目前的RGB三通道输入,从而实现对目标更加准确的识别与分类。

参考文献

Liu Z Y .

Remote sensing land use change monitoring based on special chart restriction

[J]. Journal of Anhui Agricultural Sciences, 2011.

URL     [本文引用: 1]

By using QUICKBIRD remote sensing image of Xuzhou in 2005 and SPOT5 remote sensing image in 2004,through analyzing the relationship between land cover and land utilization,the mapping relationship between them was established,transforming the land cover information to land use information.With Visual C + + 6.0 and ArcObject geographic information system second development kit,remote sensing image change monitoring auxiliary system constrained by special chart was designed.The variation map spot was extracted,the results showed that this system can quickly determine the scope of land use change,enhance the pertinence,reduce workload.

Voogt J A, Oke T R .

Thermal remote sensing of urban climates

[J]. Remote Sensing of Environment, 2003,86(3):370-384.

DOI:10.1016/S0034-4257(03)00079-8      URL     [本文引用: 1]

Thermal remote sensing has been used over urban areas to assess the urban heat island, to perform land cover classifications and as input for models of urban surface atmosphere exchange. Here, we review the use of thermal remote sensing in the study of urban climates, focusing primarily on the urban heat island effect and progress made towards answering the methodological questions posed by Roth et al. [International Journal of Remote Sensing 10 (1989) 1699]. The review demonstrates that while some progress has been made, the thermal remote sensing of urban areas has been slow to advance beyond qualitative description of thermal patterns and simple correlations. Part of the difficulty lies in the tendency to use qualitatively based land use data to describe the urban surface rather than the use of more fundamental surface descriptors. Advances in the application of thermal remote sensing to natural and agricultural surfaces suggest insight into possible methods to advance techniques and capabilities over urban areas. Improvements in the spatial and spectral resolution of current and next-generation satellite-based sensors, in more detailed surface representations of urban surfaces and in the availability of low cost, high resolution portable thermal scanners are expected to allow progress in the application of urban thermal remote sensing to the study of the climate of urban areas.

许夙晖, 慕晓冬, 柯冰 , .

基于遥感影像的军事阵地动态监测技术研究

[J]. 遥感技术与应用, 2014,29(3):511-516.

[本文引用: 1]

Xu S H, Mu X D, Ke B , et al.

Dynamic monitoring of military position based on remote sensing image

[J]. Remote Sensing Technology and Application, 2014,29(3):511-516.

[本文引用: 1]

王治中, 张庆君, 吕科 .

大数据时代航天遥感系统的挑战和机遇

[J].工程研究-跨学科视野中的工程, 2014(3):244-258.

[本文引用: 1]

Wang Z Z, Zhang Q J, Lyu K . A brief analysis of challenges and opportunities of space remote sensing system in the big data age[J].Journal of Engineering Studies, 2014(3):244-258

[本文引用: 1]

Duda R O, Hart P E, Stork D G .

Pattern Classification

[M]. New York:Wiley, 1998: 55-88.

[本文引用: 1]

Li Q, Bao W, Li X, et al.

High resolution remote sensing image classification based on SVM and FCM

[C]// International Conference on Electrical,Computer Engineering and Electronics. 2015.

[本文引用: 1]

邓曾, 李丹, 柯樱海 , .

基于改进SVM算法的高分辨率遥感影像分类

[J]. 国土资源遥感, 2016,28(3):12-18.doi: 10.6046/gtzyyg.2016.03.03.

URL     Magsci     [本文引用: 1]

<p>针对面向对象高分辨率遥感影像分类样本维数多、数据量大的特点,提出了一种简单的支持向量机(support vector machine,SVM)改进算法。首先对原始样本数据进行主成分分析(principal component analysis,PCA)实现降维,对降维后的样本数据进行SVM分类器训练,利用网格搜索法得出降维数据的最佳参数;以此参数作为基准,对基于原始样本数据的SVM分类器参数搜索范围进行重新设定,从而快速获取原始样本数据的最佳SVM分类器参数,并实现分类。利用2景WorldView2高分辨率影像分别对城市土地利用以及林木树种进行分类实验,比较分析传统SVM算法、仅基于PCA降维样本数据的SVM算法以及改进的SVM算法在分类精度与效率方面的差异。实验结果表明,改进的SVM算法能够快速有效地寻找最佳SVM分类器参数,并获得较高的分类精度。</p>

Deng Z, Li D, Ke Y H , et al.

An improved SVM algorithm for high spatial resolution remote sensing image classification

[J]. Remote Sensing for Land and Resources, 2016,28(3):12-18.doi: 10.6046/gtzyyg.2016.03.03.

Magsci     [本文引用: 1]

阎继宁, 周可法, 王金林 , .

基于SAM与SVM的高光谱遥感蚀变信息提取

[J]. 计算机工程与应用, 2013,49(19):141-146.

Magsci     [本文引用: 1]

高光谱遥感技术的发展,提高了遥感技术的定量化水平,要求人们从光谱维去理解地物在空间维的变换。提出了一种光谱角匹配技术(Spectral Angle Mapper,SAM)与支持向量机(Support Vector Machine,SVM)相结合的高光谱遥感蚀变信息提取模型,在光谱维提取地表的蚀变信息。鉴于SAM算法仅考虑波谱矢量方向,忽略辐射亮度大小的缺点,利用SVM算法对SAM的提取结果进行二次分类,利用网格搜索法并结合分类精度评估进行参数寻优。通过AVIRIS高光谱数据实验证明,提取的蚀变信息分类精度为78.172 6%,Kappa系数为0.712 5。该模型计算方便,对于解决光谱维的地物分类及相似矿物的蚀变信息提取具有一定的实际意义。

Yan J N, Zhou K F, Wang J L , et al.

Extraction of hyper-spectral remote sensing alteration information based on SAM and SVM

[J]. Computer Engineering and Applications, 2013,49(19):141-146.

Magsci     [本文引用: 1]

Wu M, Chen L.

Image recognition based on deep learning

[C]// Chinese Automation Congress.IEEE, 2015.

[本文引用: 2]

曹林林, 李海涛, 韩颜顺 , .

卷积神经网络在高分遥感影像分类中的应用

[J]. 测绘科学, 2016,41(9):170-175.

DOI:10.16251/j.cnki.1009-2307.2016.09.033      URL     [本文引用: 1]

针对目前应用于高分辨率遥感影像分类的常用算法,其精度已无法满足大数据环境下的分类要求的问题,该文提出了卷积神经网络分类算法。卷积神经网络模型降低了因图像平移、比例缩放、倾斜或者共他形式的变形而引起的误差。在大数据环境下,采用卷积神经网络算法对高分辨率遥感影像进行分类,避免了特征提取和分类过程中数据重建的复杂度,提高了分类精度。通过实验比对分析,证明了卷积神经网络在高分辨率遥感影像分类中的可行性及精度优势,对遥感图像处理领域等相关工作提供了参考价值。

Cao L L, Li H T, Han Y S , et al.

Application of convolutional neural networks in classification of high resolution remote sensing imagery

[J]. Science of Surveying and Mapping, 2016,41(9):170-175.

[本文引用: 1]

Hinton G E, Salakhutdinov R R .

Reducing the dimensionality of data with neural networks

[J]. Science, 2006,313(5786):504.

DOI:10.1126/science.1127647      URL     [本文引用: 1]

芮挺, 费建超, 周遊 , .

基于深度卷积神经网络的行人检测

[J]. 计算机工程与应用, 2016,52(13):162-166.

Magsci     [本文引用: 1]

行人检测一直是目标检测研究与应用中的热点。目前行人检测主要通过设计有效的特征提取方法建立对行人特征的描述,然后利用分类器实现二分类。卷积神经网络作为深度学习的重要组成,在图像、语音等领域得到了成功应用。针对人工设计的特征提取方法难以有效表达复杂环境下行人特征的问题,提出采用多层网络构建深度卷积神经网络实现对行人检测的方法。系统分析了卷积神经网络层数、卷积核大小、特征维数等对识别效果的影响,优化了网络参数。实验结果表明该方法对于行人检测具有很高的识别率,优于传统方法。

Rui T, Fei J C, Zhou Y , et al.

Pedestrian detection based on deep convolutional neural network

[J]. Computer Engineering and Applications, 2016,52(13):162-166.

Magsci     [本文引用: 1]

Zhang Q, Xu J, Xu L , et al.

Deep convolutional neural networks for forest fire detection

[C]//2016 International Forum on Management,Education and Information Technology Application.Atlantis Press, 2016.

[本文引用: 1]

Zhang R, Yao J, Zhang K , et al.

S-CNN ship detection from high-resolution remote sensing images

[J].ISPRS, 2016, B7:423-430.

[本文引用: 1]

Krizhevsky A, Sutskever I, Hinton G E .

ImageNet classification with deep convolutional neural networks

[J]. Advances in Neural Information Processing Systems, 2012,25(2):2012.

DOI:10.1145/3065386      URL     [本文引用: 2]

Abstract We trained a large, deep convolutional neural network to classify the 1.2 million high-resolution images in the ImageNet LSVRC-2010 contest into the 1000 dif-ferent classes. On the test data, we achieved top-1 and top-5 error rates of 37.5% and 17.0% which is considerably better than the previous state-of-the-art. The neural network, which has 60 million parameters and 650,000 neurons, consists of five convolutional layers, some of which are followed by max-pooling layers, and three fully-connected layers with a final 1000-way softmax. To make train-ing faster, we used non-saturating neurons and a very efficient GPU implemen-tation of the convolution operation. To reduce overfitting in the fully-connected layers we employed a recently-developed regularization method called "dropout" that proved to be very effective. We also entered a variant of this model in the ILSVRC-2012 competition and achieved a winning top-5 test error rate of 15.3%, compared to 26.2% achieved by the second-best entry.

Girshick R, Donahue J, Darrell T , et al.

Rich feature hierarchies for accurate object detection and semantic segmentation

[J]. Computer Science, 2014: 580-587.

DOI:10.1109/CVPR.2014.81      URL     [本文引用: 1]

Abstract: Object detection performance, as measured on the canonical PASCAL VOC dataset, has plateaued in the last few years. The best-performing methods are complex ensemble systems that typically combine multiple low-level image features with high-level context. In this paper, we propose a simple and scalable detection algorithm that improves mean average precision (mAP) by more than 30% relative to the previous best result on VOC 2012---achieving a mAP of 53.3%. Our approach combines two key insights: (1) one can apply high-capacity convolutional neural networks (CNNs) to bottom-up region proposals in order to localize and segment objects and (2) when labeled training data is scarce, supervised pre-training for an auxiliary task, followed by domain-specific fine-tuning, yields a significant performance boost. Since we combine region proposals with CNNs, we call our method R-CNN: Regions with CNN features. We also compare R-CNN to OverFeat, a recently proposed sliding-window detector based on a similar CNN architecture. We find that R-CNN outperforms OverFeat by a large margin on the 200-class ILSVRC2013 detection dataset. Source code for the complete system is available at this http URL

Yosinski J, Clune J, Bengio Y , et al.

How transferable are features in deep neural networks?

[J]. Eprint Arxiv, 2014,27:3320-3328.

[本文引用: 1]

UC Merced Land Use Dataset

[DB/OL].( 2010- 10- 28)[2017-16]. .

URL     [本文引用: 1]

Zhao B, Zhong Y, Xia G S , et al.

Dirichlet-derived multiple topic scene classification model fusing heterogeneous features for high resolution remote sensing imagery

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2015,54(4):2108-2123.

[本文引用: 1]

Liu Y, Zhong Y, Fei F, et al.

Scene semantic classification based on random-scale stretched convolutional neural network for high-spatial resolution remote sensing imagery

[C]// IGARSS 2016-2016 IEEE International Geoscience and Remote Sensing Symposium.IEEE, 2016: 763-766.

[本文引用: 3]

许夙晖, 慕晓冬, 赵鹏 , .

利用多尺度特征与深度网络对遥感影像进行场景分类

[J]. 测绘学报, 2016,45(7):834-840.

DOI:10.11947/j.AGCS.2016.20150623      URL     [本文引用: 1]

针对因样本量小而导致的遥感图像场景分类精度不高的问题,结合非下采样Contourlet变换(NSCT)、深度卷积神经网络(DCNN)和多核支持向量机(MKSVM),提出了一种基于多尺度深度卷积神经网络(MS-DCNN)的遥感图像场景分类方法。首先利用非下采样Contourlet变换方法对遥感图像多尺度分解,然后对分解后的高频子带和低频子带分别用DCNN训练得到了不同尺度的图像特征,最后采用MKSVM综合多尺度特征并实现遥感图像场景分类。对标准遥感图像分类数据集的试验结果表明,本算法能够结合低频和高频子带对不同类别场景的识别优势,对遥感图像场景取得较好的分类结果。

Xu S H, Mu X D, Zhao P , et al.

Scene classification of remote sensing image based on multi-scale feature and deep neural network

[J]. Acta Geodaetica et Cartographica Sinica, 2016,45(7):834-840.

[本文引用: 1]

Yang Y, Newsam S.

Spatial pyramid co-occurrence for image classification

[C]// International Conference on Computer Vision.IEEE, 2011: 1465-1472.

[本文引用: 1]

Marmanis D, Datcu M, Esch T , et al.

Deep learning earth observation classification using imagenet pretrained networks

[J]. IEEE Geoscience and Remote Sensing Letters, 2015,13(1):1-5.

DOI:10.1109/LGRS.2015.2499239      URL     [本文引用: 3]

Deep learning methods such as convolutional neural networks (CNNs) can deliver highly accurate classification results when provided with large enough data sets and respective labels. However, using CNNs along with limited labeled data can be problematic, as this leads to extensive overfitting. In this letter, we propose a novel method by considering a pretrained CNN designed for tackling an entirely different classification problem, namely, the ImageNet challenge, and exploit it to extract an initial set of representations. The derived representations are then transferred into a supervised CNN classifier, along with their class labels, effectively training the system. Through this two-stage framework, we successfully deal with the limited-data problem in an end-to-end processing scheme. Comparative results over the UC Merced Land Use benchmark prove that our method significantly outperforms the previously best stated results, improving the overall accuracy from 83.1% up to 92.4%. Apart from statistical improvements, our method introduces a novel feature fusion algorithm that effectively tackles the large data dimensionality by using a simple and computationally efficient approach.

/

京ICP备05055290号-2
版权所有 © 2015 《自然资源遥感》编辑部
地址:北京学院路31号中国国土资源航空物探遥感中心 邮编:100083
电话:010-62060291/62060292 E-mail:zrzyyg@163.com
本系统由北京玛格泰克科技发展有限公司设计开发