基于深度残差网络的无人机航拍图像识别

发布日期:2018年10月29日
基于深度残差网络的无人机航拍图像识别 基于深度残差网络的无人机航拍图像识别

本内容试读结束

下载后可阅读完整内容,立即下载

基于深度残差网络的无人机航拍图像识别

为了有效提高无人机航拍图像的识别准确率,本文提出了一种基于深度残差网络的深度卷积神经网络模型。该模型在深度残差网络的基础上使用了随机化ReLU激励函数,能够使网络拥有更加快速的收敛速度,同时针对深度残差网络层数较深,且部分参数在梯度下降的传播过程中参与度不高的特点,利用随机失

航拍图像是通过飞行器或卫星等设备对目标区域拍摄的图像,在军事目标侦察和民用方面具有重要作用。近年来随着无人机的快速发展,依托无人机航拍图像进行目标侦察或民用测绘作业相比卫星航拍图具有经济、高效、方便等多方面优势。而在进行航拍图像识别作业时,人工方式效率偏低,且需要进行一定的培训才能进行识别工作,成本较高。传统的算法识别通常采用特征提取加分类器选择的方式, 例如Gabor 特征、Gradient 特征结合贝叶斯分类器或支持向量机分类器的方式,虽然相对人工方式效率较高但识别率偏低,容易造成误判、错判。

近年来,随着机器学习算法的快速发展,利用深度学习技术构建图像分析识别模型,进而应用训练好的模型进行识别正越来越广泛[1] [2] [3] [4]。此种方式能够在识别正确率与人工识别率上不相上下,而且在识别速度与识别规模上优势很大。

2006 年Hinton 等人[5]提出由一组受限玻尔兹曼机组成的深度置信网络,通过逐层预训练的方式有效完成了模型训练过程,证明了神经网络模型在图像识别等领域的巨大优势。

2012 年Alex 等人[6]以五层卷积层和三层全连接层构建了Alex-Net 卷积神经网络, 利用GPU 并行训练在ImageNet 竞赛中取得高于第二名10.9 个百分比的识别结果。

2014 年Simonyan 等人[7]利用小卷积核提出了VGG-Nets,相比Alex-net,VGG-Nets 网络在训练时使用了更多的网络层次,且VGG-Nets 中的卷积层都使用了3 × 3 的滤波器。

Szegedy 等人[8]提出的GoogLeNet 同样采用了较深的网络层次, 而且使用了3 × 3 的卷积层进行升维和降维。

但是随着新的卷积神经网络模型中网络层次的逐渐加深,有时会出现训练误差不降反升的现象。为了有效解决此类问题, He 等人[9]提出了深度残差网络, 通过残差网络中的残差块结构有效预防了网络中训练损失值不再出现随着训练逐渐升高的现象。本文基于深度残差网络提出一种改进的深度卷积神经网络模型,利用随机化ReLU 函数帮助收敛,利用随机失活降低训练过程中的参数规模,降低网络中参数规模,提高整个神经网络模型的泛化性,能够有效实现无人机航拍图像的精确识别。

2. 深度卷积神经网络的基本原理 深度卷积神经网络通常由卷积层、池化层和全连接层等多个网络组成。在训练时,算法将误差由最后一层逐层向前反馈,更新每层参数,并在更新参数后再次前馈,如此往复,直到深度卷积神经网络模型收敛,从而达到模型训练的目的。通过训练得到的模型深度卷积神经网络进而可以进行样本预测,也就是进行图像识别,目标检测等工作。图1 为卷积神经网络LeNet-5 [10]的网络结构,该网络由多个卷积层、池化层(下采样层)以及数个全连接层构成。



相关标签