一种结合自注意力和门控机制的图像超分辨率重建算法

发布日期:2020年12月28日
一种结合自注意力和门控机制的图像超分辨率重建算法 一种结合自注意力和门控机制的图像超分辨率重建算法

本内容试读结束

下载后可阅读完整内容,立即下载

图像超分辨率重建旨在将低分辨率图像重建为更加清晰的高分辨率图像。超分辨率重建算法有助于提高图像质量,可以尽可能精确地恢复出原始图像缺失的纹理、细节信息,在图像处理领域具有重要的科学意义和应用价值。为了进一步提高图像重建质量,本文将稀疏表示以及深度学习算法相结合,利用稀疏表示模型得到的重构高分辨率图像作为深度学习模型的输入,在VDSR网络的基础上减少卷积层并引入自注意力机制以及门控机制,模型可以在训练过程中动态学习到不同特征的重要性,从而进一步丰富图像的特征。我们在Set5、set14、B100、Urban100等公开的超分重建数据集上进行了大量的实验,结果表明,本文提出的基于自注意力机制和门控机制残差网络图像超分辨率重建算法相较于现有的重建方法,可以获得更好的重建细节以及更高的PSNR/SSIM值。

现如今为止,图像超分辨率重建主要有三种方法,分别是基于插值、基于重建和基于学习。基于插值[1] [2]的算法重建速度比较快, 但是重建后的图像太过平滑并且图像边缘会产生锯齿效应。

基于重建的算法效果较插值法有所改善;基于学习的算法通过学习高、低分辨率图像块之间的对应关系来重建高分辨率图像,较之前的算法获得了更好的图像重建质量。

基于学习的方法分为传统方法和基于深度学习的方法。在传统方法中,稀疏表示则可以取得较好的重建效果,典型代表是Yang 等[3]提出的SCSR 算法,该算法不仅可以改善图像细节信息,同时还能够保持图像的几何结构信息, 从而得到更好的重建图像。

后来, 许多研究者对SCSR 进行了改进[4] [5] [6], 通过对字典学习算法或者特征提取算子进行改进,但由于基于传统学习模型的学习能力有限,重建图像的高频细节不够丰富。为了弥补传统学习模型的不足,提出了一些深度学习模型[7] [8] [9],并在超分辨率图像中得到了广泛的应用。

目前,一些基于卷积神经网络的深度学习方法应用在图像超分辨重建领域。Dong [10]最早提出了超分辨率SRCNN 算法,该算法建立了CNN 的端到端映射,该算法虽然结构简单,但是收敛速度慢、学习信息有限,难以取得很好的重建结果。之后,Dong [11]等人又提出了FSRCNN,此算法是基于SRCNN进行改进, 用一些小的卷积层来代替SRCNN 中大的卷积层, 在速度和重建质量上有了进一步提高。

VDSR [12]方法受到残差网络[13]结构的启发,从而进行显著的改进。VDSR 采用学习经过双三次插值后的LR图像与高分辨率图像之间的高频残差图像来进行图像超分辨率重建。这些方法的出现弥补了稀疏表示的



相关标签