针对无人机遥感影像中的车辆检测问题,本文对YOLOv5算法中损失函数仅利用边界框长宽比不能反映边界框宽高分别与其置信度的真实差异的缺点,对损失函数进行了改进,消除了因为不能反映宽高真实差异引起的收敛过慢问题。利用改进的YOLOv5算法进行了训练和检测,验证了该算法对于无人机航拍影像中车辆检测的有效性。
针对高分辨率无人机遥感影像中的交通车辆进行目标检测,可用于分析交通拥堵、道路交通违法行为,收集交通变化规律,加入交通管制,促进交通管理更加合理,对缓解交通拥堵具有重要作用[1]。基于深度学习的车辆检测算法通过卷积神经网络自动提取从原始图像浅层位置信息到高层语义信息的多层次车辆特征,利用基于神经网络的深度学习算法检测图像中的目标车辆已成为车辆检测领域的研究趋势[2] [3]。由于无人机航拍影像的视角特殊性,针对无人机遥感影像中的车辆检测目前主要面临的问题有:复杂背景[4]、目标的尺度变化[5]、特殊视角[6] [7] [8]等问题。
目前基于深度学习的图像目标检测算法模型主要使用Faster R-CNN [9], Mask R-CNN [10], Retina Net [11],Dynamic R-CNN [12],PAA [13] and ATSS [14],YOLO 系列[15] [16] [17] [18]等算法框架。邢宇驰等[19]基于YOLOv5 的遥感图像目标检测在公开的10 类地理空间物体数据集进行了检测实验, 以评估所提出模型的目标检测性能。
李珂泉等[20]按照是否存在显式的区域建议和是否定义先验锚框两种分类标准对已有的目标检测算法分类,对代表性的目标检测算法在公开数据集中的表现进行了比较和分析。马跃等[21]在分段反卷积改进SSD 的目标检测算法中提出了分段反卷积结构降低了噪声信息加入,又采用了新的融合结构对高层特征图和低层特征图进行融合,丰富了检测特征层的信息,加入了不同长宽比例的候选框和多尺度特征图对小占比目标增强检测, 减小了小占比目标的误检和漏检。
杨锦帆等[22]对比了各类常用单阶段车辆检测算法,列举其改进措施以及在车辆检测方面存在的问题,介绍了车辆检测相关数据集,对现阶段车辆检测中亟待解决的问题与难点进行了分析,提出了车辆检测未来的研究方向。冯加明等[23]提出通过删减部分残差以降低卷积层通道数并通过K-均值聚类与手动调节相结合的方式提高检测的精度。汪昱东等[24]通过在检测网络中加入物浓度判断模块来提高网络的适应性和鲁棒性。YOLOv5算法在YOLOv4 的基础上提出,其速度与精度都得到了极大的性能提升,被广泛应用于遥感影像目标检测。本文针对YOLOv5 算法中损失函数仅使用长宽比并不能反映边界框宽高分别与其置信度的真实差异的缺点,对损失函数进行了改进,消除了损失函数因为不能反映宽高真实差异引起的收敛过慢问题,提高了算法的检测精度。