卷积神经网络特征在遥感图像配准中的应用
南昌大学信息工程学院,南昌 330031
Application of convolutional neural network feature to remote sensing image registration
School of Information Engineering, Nanchang University, Nanchang, 330031, China
通讯作者: 闵卫东(1966-),男,教授,主要从事计算机图像与视频处理、计算机图形学等研究。Email:minweidong@ncu.edu.cn。
责任编辑: 张仙
收稿日期: 2018-03-21 修回日期: 2018-06-7 网络出版日期: 2019-06-15
基金资助: |
|
Received: 2018-03-21 Revised: 2018-06-7 Online: 2019-06-15
作者简介 About authors
叶发茂(1978-),男,副教授,主要从事遥感图像处理和人工智能方面研究。Email:yefamao@ncu.edu.cn。 。
遥感图像配准是许多遥感应用的重要步骤之一。卷积神经网络(convolutional neural network, CNN)提取的图像高层特征在图像分类和检索问题上表现优异,能够克服低层配准特征的表达能力有限、容易受到干扰等问题。因此对利用CNN特征进行遥感图像配准开展研究。首先,针对遥感图像配准问题,对CNN中的全连接层特征和不同聚合大小的卷积层特征进行了研究; 然后,对利用CNN特征进行图像配准的方法进行了分析; 最后,将CNN特征与尺度不变特征变换(scale-invariant feature transform, SIFT)特征在图像的旋转角度、缩放倍数和亮度依次变换时的配准性能进行了对比分析。实验结果表明,在匹配精度和正确对应点的数量方面,CNN特征比SIFT方法具有更好的匹配性能; 对变换后的图像而言,微调后的CNN特征比SIFT特征具有更强的鲁棒性。
关键词:
Successful remote sensing image registration is one of the foundations of many remote sensing applications. Image high-lever features extracted by convolutional neural network (CNN) have achieved excellent performance in image classification and retrieval, and can be used to solve some problems of low-lever image registration features, such as the limitation of expression capability and easily being interfered. Hence, in this paper, the authors investigated the problem as to how to use CNN feature for remote sensing image registration. First, the authors investigated different CNN features from fully connected layers and aggregating convolutional features with different sizes from convolutional layer to register remote sensing image. Then the authors introduced the procedure by using CNN feature for image registration. Finally, the authors compared the registration performances of CNN features and scale-invariant feature transform (SIFT) features after the transformation of the image’s perspective, brightness and scale, respectively. The experimental results show that the CNN feature has better matching performance than the SIFT method in terms of matching accuracy and correct number of corresponding points. The finely tuned CNN feature has stronger robustness to the transformed image than the SIFT feature.
Keywords:
本文引用格式
叶发茂, 罗威, 苏燕飞, 赵旭青, 肖慧, 闵卫东.
YE Famao, LUO Wei, SU Yanfei, ZHAO Xuqing, XIAO Hui, MIN Weidong.
0 引言
通过遥感图像配准可以获取同一场景中不同时间、不同类型的遥感图像之间的空间变换关系,因此图像配准是遥感图像融合或变化检测等许多遥感任务中不可或缺的部分。
一般来说,遥感图像配准方法大致可以分为基于图像灰度的方法和基于图像特征的方法2种[1]。其中,基于图像灰度的方法是通过计算待配准图像与参考图像之间像素灰度的最大相似性,寻找相似性度量最大的几何变换,最常用的相似性度量有互相关和互信息[2]。然而,基于图像灰度的方法相似性度量计算量大,易受纹理干扰。基于图像特征的方法通过检测明显且稳定的匹配特征来估计图像之间的几何变换,可大大减少图像配准过程中的计算量,且能够克服基于图像灰度的方法对图像灰度敏感等缺点,已经成为遥感图像配准研究的主要发展方向[3]。张谦等[3]采用尺度不变特征变换(scale-invariant feature transform, SIFT)特征和由粗到精的多级匹配策略进行多源遥感图像配准; 李少毅等[4]利用加速稳健特征(speeded up robust features, SURF)进行彩色遥感图像配准; Yang等[5]利用格陵兰冰盖上的冰面河流特征配准高精度卫星图像。但这些低层特征表达能力有限,易受到旋转角度、缩放倍数和亮度等因素干扰,从而有可能导致配准失败。
随着深度学习方法的发展,卷积神经网络(convolutional neural network, CNN)[6,7]已在图像分类[8]、图像检索[9,10]和目标识别[11]等领域得到广泛应用,并取得令人瞩目的成绩。在这些应用中,从利用大规模数据集ImageNet预训练的CNN模型中提取的中高层特征比常见的低层特征表现得更优秀,具有更好的性能。为了充分利用CNN强大的特征提取和表示能力,并克服低层特征的不稳定性、提高配准的可靠性,本文对应用CNN特征进行图像配准的性能开展研究。首先,研究和分析了不同的CNN中的全连接层特征和不同聚合大小的卷积层特征; 接着,研究了利用这些特征进行遥感图像配准的方法; 然后,通过实验验证了该方法的可行性; 最后,通过定量方法分析其在图像的旋转角度、缩放倍数和亮度分别变换时的性能,并与传统SIFT特征的性能进行了对比分析。
1 基于CNN特征的遥感图像配准
1.1 CNN模型
CNN模仿了动物视觉皮层组织神经元之间的连接模式,是一种多层前馈人工神经网络的深层学习结构[12]。该模型可以直接输入原始图像,因其避免了对图像的复杂前期预处理而得到了更为广泛的应用,是众多科学领域,特别是图像分类、识别领域研究热点之一。CNN一般由多个卷积层、池化层和全连接层相互连接而成。卷积层利用各种卷积核对输入进行卷积运算,提取各种特征; 池化层通过池化操作对输入进行降维,从而减少网络参数的数量; 全连接层通常是CNN的最后部分,是一种传统的多层感知器网络,其每一个神经元都与前一层的每一个神经元相连接。网络最后输出输入图像的高层特征,经过分类器统计计算,输出该输入图像所对应类别标签的概率。
图1
1.2 全连接层的特征
CNN能够提取不同层次的特征,并且这些特征的层次从前往后依次增加。本文从AlexNet模型中提取配准特征。由于AlexNet模型的最后一层(FC8层)的1 000维特征是来自ImageNet的1 000个类别的后验概率分数,其通常用于分类,因此舍弃FC8层,采用4 096个维数的FC7和FC6层的输出用于CNN的遥感图像配准。
1.3 聚合卷积特征
全连接层特征是复杂的高层特征,可以在一定程度上视为全局特征。由于卷积层特征在遥感图像检索等领域表现出比全连接层特征更好的性能[13],因此需对各种维数的卷积层特征进行遥感图像配准分析。
卷积层输出的是一个由
图1所示的AlexNet模型的Conv5层输出是256个大小为
1.4 预训练的CNN模型微调
为了使得从AlexNet模型提取的特征更适合遥感图像配准,本文建立了一个配准数据库对预先训练的AlexNet模型进行微调。首先,人工配准16组遥感图像; 然后,从这些图像对中提取数量N=3 756个
在微调过程中,利用预先训练的AlexNet模型初始化权重,学习速率设为0.001,动量值为0.9,权值衰减值设为0.000 5。
1.5 基于CNN特征的图像配准
基于CNN特征的配准流程如图2所示。
图2
首先,对参考图像和待配准图像采用SIFT方法检测特征点; 其次,截取以特征点为中心的尺寸为
2 实验及分析
2.1 配准结果
图3
图4
2.2 定量分析
为了对遥感图像配准的性能进行定量分析,采用以下3种评价准则来对本文方法进行评估。
1)
式中: n为对应点对数量;
2)
3)
利用以上评价准则对SIFT特征、FC特征(FC7,FC6)和聚合卷积特征(Agg1, Agg2, Agg3, Agg4)的配准性能进行比较分析。在4个图像对上利用这些特征进行配准的精度如表1所示。其中fine-tuning表示微调的特征,pre-trained表示预训练的特征。
表1 不同特征的图像配准精度
Tab.1
特征 | P-A图像 | P-B图像 | P-C图像 | P-D图像 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
SIFT | 0.040 8 | 0.040 9 | 64 | 0.092 1 | 0.094 1 | 24 | 0.070 5 | 0.070 6 | 42 | 0.913 4 | 1.015 0 | 7 |
0.034 2 | 0.034 2 | 72 | 0.079 6 | 0.081 3 | 27 | 0.038 1 | 0.039 0 | 49 | 0.800 2 | 0.820 2 | 8 | |
0.034 2 | 0.034 2 | 72 | 0.079 6 | 0.081 3 | 27 | 0.036 2 | 0.037 1 | 50 | 0.662 2 | 0.839 8 | 11 | |
0.034 2 | 0.034 2 | 72 | 0.079 6 | 0.081 3 | 27 | 0.036 2 | 0.037 1 | 50 | 0.698 7 | 1.077 3 | 10 | |
0.034 2 | 0.034 2 | 72 | 0.079 6 | 0.081 3 | 27 | 0.036 2 | 0.037 1 | 50 | 0.670 0 | 0.714 4 | 10 | |
0.034 2 | 0.034 2 | 72 | 0.079 6 | 0.081 3 | 27 | 0.038 1 | 0.039 0 | 49 | 0.737 1 | 0.758 8 | 7 | |
0.043 1 | 0.043 3 | 56 | 0.109 8 | 0.111 5 | 22 | 0.038 1 | 0.039 0 | 49 | 2.656 5 | 3.116 7 | 3 | |
0.038 0 | 0.038 1 | 65 | 0.094 6 | 0.097 3 | 25 | 0.043 3 | 0.044 4 | 43 | 1.893 5 | 3.635 3 | 4 | |
0.037 7 | 0.037 8 | 71 | 0.079 6 | 0.081 3 | 27 | 0.042 8 | 0.043 8 | 46 | 1.286 7 | 1.311 3 | 5 | |
0.034 2 | 0.034 2 | 72 | 0.079 6 | 0.081 3 | 27 | 0.038 1 | 0.039 0 | 49 | 0.800 2 | 0.820 2 | 8 | |
0.034 2 | 0.034 2 | 72 | 0.079 6 | 0.081 3 | 27 | 0.040 6 | 0.041 5 | 48 | 1.044 4 | 1.339 5 | 7 | |
0.037 9 | 0.038 0 | 70 | 0.079 6 | 0.081 3 | 27 | 0.040 6 | 0.041 5 | 48 | 0.732 0 | 0.762 7 | 8 | |
0.063 8 | 0.065 6 | 18 | 0.263 2 | 0.261 3 | 9 | 0.040 7 | 0.041 6 | 46 | 9.711 4 | 11.32 4 | 3 |
可以看出,微调的FC6特征的
为了进一步评估微调的CNN配准特征(FC7,FC6,Agg2)和SIFT特征对各种图像变换的鲁棒性,对以上4个测试图像对分别进行旋转、缩放和亮度不同大小变换,并根据
图5
3 结论
1)在AlexNet模型中,全连接层FC6特征相对于其他特征在遥感图像配准方面具有更好的性能。
2)对于大多数变换,微调后的CNN特征比SIFT特征具有较好的配准效果,微调后的CNN特征具有更强的鲁棒性。
3)通过自定义数据集对CNN网络进行微调可以提高CNN特征在遥感图像配准中的性能。
目前,已有许多更为复杂的CNN网络被提出。在后续的研究中,将进一步研究和比较这些CNN网络中的各种特征在遥感图像配准中的性能。
参考文献
Image registration methods:A survey
[J].DOI:10.1016/S0262-8856(03)00137-9 URL [本文引用: 1]
A novel coarse-to-fine scheme for automatic image registration based on sift and mutual information
[J].DOI:10.1109/TGRS.2013.2281391 URL [本文引用: 1]
多源遥感影像配准中的SIFT特征匹配改进
[J].针对尺度不变特征变换算法应用于多源遥感影像配准时面临的低效率和误匹配问题,从特征点提取和特征点匹配两个方面对其进行改进。在特征点提取阶段,通过控制特征点数量和分布情况获取均匀分布的特征点;在特征点匹配阶段,采用特征点仿射变换粗匹配、精匹配和误匹配点剔除策略,由粗到精地获取准确的同名点。对多源遥感影像进行配准实验,结果表明,此方法在匹配效率及匹配性能上均优于原始SIFT算法,且配准精度更高。
An improved SIFT algorithm for multi-source remote sensing image registration
[J].
改进的SURF彩色遥感图像配准算法
[J].
An improved SURF algorithm for color remote sensing image registration
[J].
Automated high-resolution satellite image registration using supraglacial rivers on the Greenland ice sheet
[J].
ImageNet classification with deep convolutional neural networks
[J].
Simonyan K,Zisserman A.Very deep convolutional networks for large-scale image recognition
[EB/OL].(
A practical guide to CNNs and fisher vectors for image instance retrieval
[J].
基于深度卷积特征的细粒度图像分类研究综述
[J].
A survey on fine-grained image categorization using deep convolutional features
[J].
深度学习的半监督遥感图像检索
[J].
Retrieval of remote sensing images based on semisupervised deep learning
[J].
特征融合的卷积神经网络多波段舰船目标识别
[J].
Convolutional neural network based multi-band ship target recognition with feature fusion
[J].
SIFT on manifold:An intrinsic description
[J].DOI:10.1016/j.neucom.2013.01.020 URL [本文引用: 1]
Babenko A,Lempitsky V.Aggregating deep convolutional features for image retrieval
[EB/OL].(
Selective convolutional descriptor aggregation for fine-grained image retrieval
[J].DOI:10.1109/TIP.2017.2688133 URL [本文引用: 1]
Measures for an objective evaluation of the geometric correction process quality
[J].DOI:10.1109/LGRS.2008.2012441 URL [本文引用: 1]
/
〈 |
|
〉 |
