面向高分辨率遥感影像车辆检测的深度学习模型综述及适应性研究
吕雅楠, 朱红, 孟健, 崔成玲, 宋其淇

A review and adaptability study of deep learning models for vehicle detection based on high-resolution remote sensing images
LYU Yanan, ZHU Hong, MENG Jian, CUI Chengling, SONG Qiqi
表1 双阶段遥感影像车辆目标检测对比
Tab.1 Comparison of two-stage remote sensing image vehicle target detection
模型 优点 缺点 检测精度
GoogLeNet[12] 引入超分辨率重建算法加强车辆特征信息 对密集目标检测效果差 自制遥感影像数据集上精度为0.75
AVPN+VALN[13] 提出VALN网络实现车辆方向信息检测,融合深浅层特征信息以提高小目标检测精度 网络结构复杂,训练检测时间成本较高 DLR[14]数据集上精度为0.92
ZF[15] 针对数据集自身特点,结合区域生成网络设置3种对应大小及比例的锚框,加快了检测速度 数据量小、来源单一,模型检测鲁棒性较差 自制遥感影像数据集上精度为0.88
DF-RCNN[16] 融合深浅层特征信息、引入可变形卷积和可变形感兴趣区域池化,改善密集区域小目标检测效果 网络计算量较大,检测耗时较长 自制Google Earth数据集上精度为
0.94
VGGNet[17] 网络层数可以随数据集图像大小进行调整 图像深层特征提取不充分,没有充分利用上下文语义信息 自制Google Earth数据集上精度为
0.89
VGG-16[18] 基于超像素分割提取道路区域进行车辆检测,缩小了检测范围 操作较为复杂,检测时间较长,对于非道路区域内车辆会造成漏检 DOTA[19]数据集上精度为0.73
SORCN[20] 加入道路区域分割提高检测精度 运行速度较慢,无法预测车辆方向信息,模型抗干扰性差,对于非道路区域内车辆无法检测 自制Google Earth数据集上精度为
0.96
Faster R-CNN++[21] 对遥感影像车辆进行多尺度融合及数据增强,提高了模型鲁棒性与小目标检测精度 检测速度较慢,无法实现车辆方向检测 DLR数据集上精度为0.57; Potsdam[22]数据集上精度为0.67; VEDAI[23]数据集上精度为0.458