多尺度注意力机制的水下图像增强算法

发布日期:2021年10月14日
多尺度注意力机制的水下图像增强算法 多尺度注意力机制的水下图像增强算法

本内容试读结束

下载后可阅读完整内容,立即下载

由于不同波长的光在水环境中的衰减差异,原始的水下图像会出现偏绿、偏蓝和白雾的问题。针对水下图像增强出现的上述问题,本文通过结合多尺度密集块和注意力机制,提出了一个生成式对抗网络。在生成器中使用多尺度残差密集块,在后端使用注意力机制块来关注前端的特征,前者用来提高网络学习能力,后者增强网络的特征选择能力。判别器的每一层都使用谱归一化,放宽判别标准,以减少异常数据引起的梯度崩溃。同时,结合多种损失函数来增强生成对抗网络的泛化能力。提出的算法在公共数据集上进行了测试,并在实际应用中得到了验证。实验结果表明,该算法比现有算法有更好的性能。

近年来,水下图像增强已经吸引了研究人员的广泛关注。水下图像的质量受光的影响最大,不同波长的光传播的距离不同。水深越深,长波在水中的衰减就越严重,影响也就越强[1]。此外,图像的衰减实际上是多种因素综合作用的结果,如水温、微生物的种类和数量。由于水下图像既是水下信息的载体, 又是水下场景的表现形式,在探测和感知水下环境方面起着不可替代的作用。因此,水下图像增强仍然是一项亟需解决的艰巨任务。

深度学习在视觉任务中的成功,如目标检测和图像分割,激发了越来越多的深度模型在图像恢复中的应用[2]。然而,对于水下任务来说,数据集是一个难以解决的问题。现有的水下数据集相对稀少,而且参考图像的质量很难与自然图像相比。生成对抗网络(GAN)比其他基于深度学习的模型显示出更好的视觉效果。它将图像恢复问题转化为图像生成问题,其独特的自主生成特性,缓解了高质量数据集的一些压力。目前,已经提出许多有效的方法用于水下图像增强任务。

然而,对于基于GAN 的水下图像增强方法,仍然存在一些限制。首先,用于训练的水下图像数据集的多样性是不够的。根据[3]中测量的十个不同的水体的结果,淡水和咸水水体之间存在很大的差异。不同纬度的水体和不同强度的环境光导致同一水下目标的颜色有所不同。其次,生成的模型对特殊的数据特征没有给予足够的重视。根据经典的Jaffe-McGlamery 水下成像模型[4],白色雾状模糊团往往出现在浅水区。随着水深的增加,不同波长的光的衰减是非线性的,色彩对比度逐渐降低。这导致了在一定深度下的显著内容损失, 使得GAN 模型很难将白雾从图像场景中区分出来, 增强结果会出现对比度偏差并出现难以解决的模糊感。

第三, 由于现有的GAN 模型采用动态平衡作为收敛的判断结果, 因此结果不够稳定,传统的对抗性损失在训练的早期阶段很难收敛,这会对增强效果产生影响。

在本文中,我们提出了一个条件生成对抗网络(c-GAN),它结合了多尺度密集块和注意力机制,主要贡献如下: 1) 提出了一个结合多尺度密集块和注意力机制块的生成器网络,直接从退化的图像中获得增强的结果,而不需要预先构建水下退化模型。

2) 使用多个内容损失函数来约束网络,限制GAN 网络的梯度。放宽判别标准,使网络更加关注关



相关标签