一种用于遥感图像目标检测的特征融合检测模型

发布日期:2021年10月25日
一种用于遥感图像目标检测的特征融合检测模型 一种用于遥感图像目标检测的特征融合检测模型

本内容试读结束

下载后可阅读完整内容,立即下载

遥感图像和自然图像的差异导致目标检测在遥感图像中效果不佳,因此本文将注意力机制运用到特征提取的过程中,提高特征提取的能力。并使用自注意力机制对所提取各层级特征信息进行融合,基于集成特征做后续的目标检测,提高在目标多尺度问题上的表现。本文在DIOR数据集验证网络模型的可行性,并与当前常见的目标检测模型进行对比验证,取得了67.1%的全类平均精度。实验表明,该模型对比于其他常见目标检测模型在遥感图像上的检测性能有显著地提升。

遥感作为对地观测的重要工具,已广泛应用于生态环境监测、天气预报等军事和民用领域。近年来, 随着遥感技术的不断发展,遥感图像数量急剧增加,传统的人工解译已经成为一项艰巨的任务。目标检测是指识别感兴趣目标的对应类别并标记其位置,对于遥感图像的图像理解有着重要的作用。

近年来,许多基于卷积神经网络的目标检测模型取得了显著的效果[1]。基于深度学习的目标检测算法大致可分为两阶段检测法[2]和一阶段检测法[3] [4]。两阶段目标检测算法包括两个阶段:方案的生成阶段和方案的回归分类阶段。在第一阶段,基于骨干网络提取的特征地图,通过区域提案网络(RPN)为每幅图像生成一系列提案框。在第二阶段,根据方案对特征图进行裁剪,然后调整到相同的大小,并进一步利用裁剪后的特征图对对象类别进行预测,并对方案的位置进行微调,使预测更加准确。在一阶段的目标检测算法中,目标检测被看作是一个回归问题。利用多个比例和长宽比在图像的不同位置设置密集采样锚盒,然后利用卷积神经网络进行特征提取,直接对目标进行分类和预测。整个过程只需要一步, 检测速度比两步法快。然而,一阶段目标检测算法有一个明显的缺陷。密集采样锚盒会使目标探测器的正负样本极不平衡,且负样本的数量将远远大于阳性样本的数量,导致后续的预测效果不佳。

但目标检测在航空图像中的进展却比较缓慢[5]。这主要是因为遥感图像与自然图像之间存在着巨大的差异。遥感图像通常由卫星或者飞行器在高空俯视拍摄,包含较大的场景,但目标物体体积占比小且尺寸变化大、背景复杂。自然图像与遥感图像之间的差异导致了目标检测算法在遥感图像中表现不佳。

针对于遥感图像的特点,本文提出了一种适用于遥感图像的目标检测模型。本文的主要贡献分为两个部分: 1) 将注意力机制运用在特征提取的过程中,解决遥感图像目标体积小、背景复杂的问题。

2) 利用自注意力机制对特征提取网络各层级特征图进行融合, 提高模型对于目标多尺度问题的表现。

本文结构如下:第二章介绍特征提取与目标多尺度问题的相关工作,第三章介绍提出的方法,第四章展示实验,第五章总结本文。

2. 相关工作 VGG [6]网络是一种常用的目标特征提取网络。该网络使用了更小的卷积核(都使用了3 × 3 的核), 并加深了模型结构, 从而获得了更好的特征提取效果。

在一定程度上深化模型结构有助于提高网络性能, 但是随着网络层数的增加,网络将变得难以训练,并且可能发生梯度退化,从而错过最佳收敛并导致更



相关标签