我国自乡村振兴战略施行以来,不断促进乡村耕地的改良扩张,通过遥感图像对其面积的检测提取对于保障我国农村产业发展起到至关重要的作用。针对本文采用的数据集,普通DeepLabV3+模型缺少对条形结构区域以及离散结构区域特征的关注,并且缺少自适应的特征层融合过程,针对该问题,本文提出一种以MobileNetV2为骨干网络的轻量型改进DeepLabV3+模型。首先,通过MobileNetV2提取遥感图像特征;其次,将空间金字塔模块(ASPP)中的全局平均池化层替换为条形池化层,便于提取条形区域以及离散区域的特征信息;最后,为了获得多尺度特征信息,加入自适应特征融合模块,对不同特征层的特征进行融合,提高网络的特征表达能力。实验结果表明在不同类型的数据集中,改进DeepLabV3+模型的性能相比普通DeepLabV3+模型以及现有主流网络模型得到了一定提升,一定程度上改善了DeepLabV3+的不足,提高了遥感图像语义分割能力。
图像语义分割作为人工智能的热点之一,在农业、医学、交通等领域发挥着至关重要的作用。在我国,实施乡村振兴战略之后,通过Landsat8 卫星、Modis 卫星或无人机提供的遥感图像或鸟瞰图对水稻种植面积提取、农业耕地识别等图像语义分割技术为普惠金融、农业保险以及农村产业发展提供了有力的支撑。
对于图像语义分割, 2012 年AlexNet [1]的提出为深度学习的发展奠定了快速发展的基石;2013 年深度卷积网络(DCNN) [2]通过提取网络更深的语义信息,与传统的机器学习方法相比具有更强大的特征提取能力;2015 年UNet [3]和SetNet [4]等基于编码–解码结构的网络结构发挥了全卷积神经网络(FCN) [5]的优势, 其中UNet 对不同通道级通过下采样与上采样进行特征融合, 使得模型的特征表达能力更加突出;2014 年开始提出DeepLab 系列,DeepLabV1 [6]通过去掉池化层保证了特征的平移不变性,并加入空洞卷积扩大感受野避免获得有限的特征信息,DeepLabV2 [7]提出空洞空间金字塔池化层(ASPP)以获得多尺度的特征信息,DeepLabV3 [8]加深了网络结构,在空间金字塔池化层中融合了位置信息,并在DeepLabV3+ [9]则采用了编码–解码结构, 通过对深层特征上采样与浅层特征进行融合, 增加了图像的语义分割能力, 但同时也存在一定的不足,如:边缘信息不明确、分割大目标存在孔洞等。
随着深度学习的发展,注意力机制成为提高模型精确度的必要手段之一,一些学者尝试将注意力机