基于深度学习的无人机目标检测研究综述

发布日期:2023年5月31日
基于深度学习的无人机目标检测研究综述 基于深度学习的无人机目标检测研究综述

本内容试读结束

下载后可阅读完整内容,立即下载

无人机具有体积小、灵活性强、航拍视野广等特点,广泛应用于警用巡查、城市交通监管、天气监测、电力巡检、应急救援救灾等行业。近年来,随着计算机视觉领域的蓬勃发展,基于深度学习的目标检测技术逐渐应用于无人机领域,并不断得到改进和加强。本文系统性地阐述了基于深度学习的目标检测技术发展历程和研究现状。针对现阶段无人机航拍影像小目标多、背景复杂、目标尺度变化大的特性,归纳和分析了近期对无人机目标检测的相关研究。最后,展望了基于深度学习的无人机目标检测技术的未来发展趋势。

随着科技的发展,无人机(UAV)已经摆脱了过去的军事用途,逐渐扩展到民用和商用领域。随着无人机技术的发展,基于深度学习的目标检测技术已成为无人机应用领域的重要研究内容[1]。将目标检测技术应用于无人机上,实现在航拍视角下对地面场景的目标检测和识别。然而,在无人机航拍图像中, 检测对象多为小目标,受航拍视角影响,目标尺度变化较大;图像背景复杂,目标对象易被遮挡。给无人机的目标检测带来了诸多挑战[2]。常规的目标检测算法应用于无人机上难以保证检测精确度,优化无人机的目标检测性能成为了无人机应用领域的重要研究内容[3] [4]。

本文首先介绍基于深度学习的目标检测研究进展,然后总结现阶段无人机领域目标检测的研究难点,针对小目标检测、背景复杂、多尺度变化三个方面进行改进和优化的各类方法进行了阐述。最后,对未来无人机目标检测的研究方向做出了展望。

2. 基于深度学习的目标检测 伴随着卷积神经网络的兴起,基于深度学习的目标检测算法因其检测性能较高,已逐步取代传统的目标检测算法,目前已成为目标检测应用领域最主流的算法。基于深度学习的目标检测算法主要分为两类:两阶段(Two-Stage)模型和单阶段(One-Stage)模型。

2.1. 基于两阶段方法的目标检测 两阶段(Two-Stage)模型是将检测任务分为选取候选区域和对所选取的候选区域进行分类这两个阶段的一种目标检测算法,最终输出目标检测的结果。因此,基于两阶段方法的目标检测又被称为基于候选区域的方法。

2014 年Girshick 等[5]提出一种将Region Proposal 和CNN 结合的R-CNN 算法,使得检测性能相较于Overfeat 大幅提升。He K 等[6]在卷积神经网络的卷积层和全连接层之间,增加了空间金字塔池化层(SSP),解决了CNN 中对于图片固定输入大小的限制。与R-CNN 相比,避免了对图像进行特征提取时的重复运算, 检测性能进一步提升。

2015 年, Girshick R 等[7]在R-CNN 的基础上结合SPP-Net 网络的优点, 提出了Fast R-CNN。相较于R-CNN 明显缩短了训练和测试的时间。在此之后,Ren S 等[8]提出的Faster R-CNN 采用区域投标网络(Region Proposal Network, RPN),大大提升了算法的检测速度。2017 年,He K等[9]通过引入感兴趣区域聚集层(RoI Align)解决了特征图谱对应位置偏差的问题,提出了检测效果更为



相关标签