利用无人机等方式开展道路巡检时采集的图像存在图像背景复杂以及目标较小等问题,准确识别道路异常目标成为智能巡检研究热点。本文对两阶段目标检测算法Faster-RCNN进行改进,利用深度残差网络ResNet50作为网络的特征提取backbone,并利用不同层次的特征构造特征金字塔FPN网络,提高了道路异常状态检测模型的性能。
道路在长期的交通负荷以及恶劣的自然环境条件下出现裂缝、坑槽、落石、塌陷等异常状态[1],传统的道路异常巡检方式是采用人工方式,人工方式需要工作人员到道路现场进行巡视、测量、记录和分析道路问题,该方式受人员主观观念影响较大,检测效率低,危险性较高,实现过程消耗成本大,因而逐渐被淘汰。近年来,深度学习得益于计算机硬件技术的发展,在人工智能、目标检测、图像识别等领域取得了重大进展,卷积神经网络强大的特征提取能力使得计算机视觉任务的精度和效率都达到了极高的水平。基于深度学习的目标检测[2]是指从输入图像中识别出感兴趣目标并将目标类别以及在图像中的位置作为结果进行返回的技术。根据目标检测实现步骤的不同,深度学习目标检测框架可分为基于候选区域的Two-stage 框架以及基于边框回归的One-stage 框架。
基于候选区域的目标检测算法有:R-CNN [2]、Fast R-CNN [3]、Faster R-CNN [4]等。基于边框回归的检测算法有:YOLO [5]系列、SSD [6]等。
相较于可以直接对输入图像目标检测输出的One-stage 模型,Two-stage 模型在检测速度上稍逊色, 但其检测精准度很高,本文以基于Two-stage 模型的Faster R-CNN 算法作为道路异常检测的基础框架, 改进其特征提取骨干网络,并引入FPN 特征融合模型,提高了模型的多尺度特征提取和整合能力,经实验表明,改进后的算法对各类复杂背景下的道路异常情况具有较好的检测和识别能力。
2. Faster R-CNN 目标检测算法原理 基于候选区域的Faster R-CNN 目标检测算法将目标检测分两步完成:首先进行可能包含目标的区域提取并对推荐区域进行特征提取,而后进行目标分类及边框回归得到检测目标的类别及位置。其网络结构如图1 所示, 该模型由特征提取骨干网络(backbone)、区域推荐网络(RPN)、感兴趣区域池化(ROIpooling)层及检测子网络四部分构成,其实现目标检测流程如下: Figure 1. Block diagram of Faster R-CNN algorithm 图1. Faster R-CNN 算法框图