DeepLabv3+网络能够有效地解决高分辨率遥感图像语义分割的挑战。经过ResNet50骨干网络的支持,我们对DeepLabv3+模型进行了深入的研究,利用Adam梯度下降法和RELU激活函数,有效地处理了遥感影像中的建筑屋顶,提高了语义分割的精度和速度,能够更快地收敛到最优解。同时,空洞空间金字塔池化模块(ASPP)与解码器模块(decoder)的普通卷积部分被并行加权的空洞卷积代替,从而减少参数数量,提升模型的性能。IoU的准确度达到89.2%,超过DeepLabv3+算法,降低了特征提取的误差,同时也大大减少了细节信息的丢失,为最终的语义分割带来了显著的改善。
传统的建筑物提取多是将使用手工提取的特征当做判断标准,同时基于边缘检测或者影像特征。在处理复杂的环境中,往往无法获得令人满意的效果。之后有人提出使用概率图模型,同时把卷积操作设置扩张率, 这样为后来研究者对模型进行优化提供了很好地思路[1] [2]。
通过精确地分割和提取建筑屋顶可以大大改善地理信息的处理效率,从而为城市规划、资源检测以及国家安全等领域带来极大的便利[3] [4] [5] [6] [7]。在本研究中,首先使用遥感图像获取了建筑物屋顶的图像数据,然后使用deeplabv3+模型对这些数据进行了语义分割。提出的模型在ASPP 模块中添加注意力机制,并将空洞卷积替换为并行加权空洞卷积,进一步提高模型的分割精度。利用遥感技术可以获得大量的建筑物屋顶信息,这些信息具有丰富的语义和纹理特征,但由于存在大量的冗余数据,所以如何处理海量高质量遥感影像,并且得到有效的信息在遥感领域中显得尤为重要[8] [9] [10] [11]。
2. 研究方法 2.1. DeepLabv3+网络 Google 的deeplab 已经发布了四个版本,其中DeepLabv3 基于DeepLabv2 的基础上,开发出ASPP模型[12],但如果3 × 3 的空洞卷积无法达到特征图的尺寸,就会导致1 × 1 的卷积失效,从而无法完整地捕捉到图像的信息。DeepLabv3 通过增加一个1 × 1 的卷积层,大大改善了aspp 模块的性能,使得图片可以达到更高的分辨率,从而提高了图像处理的效率。DeepLabv3+网络本质上是基于DeepLabv3 网络进行的改进, 在原有的基础上添加了解码器(Decoder)模块, 通过结合底层的特征信息来增强分割效果[13] [14] [15] [16]。
DeepLabv3+架构由两个核心部分组成:编码器和解码器。编码器模块负责提取高层特征,它的主要网络结构是ResNet50,使用空洞卷积来取代传统的标准卷积,可以大大拓宽网络的感知范围。空洞卷积的本质就是带有空洞的卷积,达到在无需大幅度缩小图像尺寸的前提下获得更大的感受野范围的目的。
DCNN (深度卷积神经网络)利用ASPP 模块提取出的复杂的多尺度上下文数据, 可以提供更为全面的多尺度上下文信息。
ASPP 模块由5 个分支组成,包括一个全局平均池化和四个空洞卷积层, 其中一个卷