图像配准在手术导航、肿瘤监测等临床医学图像分析领域有着重要应用。本文针对现有无监督单模图像匹配算法的配准精度不够高的问题,提出了一种基于深度学习的无监督单模态医学图像配准算法。该方法引入短连接与长连接结合形成密集连接,改进了U-Net的特征图连接方式,解决相连接两特征图由于采样深度差距较大而产生较大语义差距的问题;在U型网络的解码器上设计部署了通道注意力机制,能够有效抑制噪音,产生更加光滑的形变场,从而进一步提高后续配准精度。在临床应用的单模态脑部核磁共振图像数据集上进行了训练及测试,结果表明,本文提出算法在配准精度上有了一定的提高。
利用计算机视觉进行医学图像处理在临床医学中有着举足轻重的作用,可以大大提高医生在疾病诊断中的效率,也能避免医生因视觉疲劳造成的误判现象。例如利用设备拍摄的医学图像进行手术导航, 通过不同时期拍摄的医学图像观察肿瘤生长情况等临床应用[1]。对于这些图像的处理毫无例外,都要进行配准对齐,即两幅图像进行融合,使其在空间坐标上保持一致。
近年来,由于深度学习的方法能用于增强迭代、增强基于强度的配准性能,在医学图像配准领域得到了广泛的应用[2]。基于深度学习的配准分为监督学习[3]的方法和无监督学习[4] [5]的方法。二者都利用神经网络估计变换参数,相较于传统配准算法的泛化性更高。监督学习的方法指的是训练时需要数据样本的标签,即真实形变场,利用神经网络来执行配准过程。Yang 等人[6]首次提出直接基于图像外观的变换模型,逐一预测各个模块来实现医学图像的配准, 其将固定图像和移动图像组成的图像对作为输入, 通过U 型网络编解码的初始动量来获得形变场, 形变场用于将移动图像重新采样为参考固定图像的图像。
Sokooti 等人[7]提出利用多尺度卷积神经网络(Convolutional Neural Network, CNN)来直接获取形变场的方法,其配准精度优于传统B 样条的配准方法。基于无监督学习的方法可以利用原始图像进行训练,克服了对标签数据的依赖。Bob 等人[4]提出用于无监督仿射和可变形图像配准的深度学习图像配准(Deep Learning Image Registration, DLIR)框架,利用图像对之间的图像相似性来训练CNN 而无需标签数据,通过分析图像对来学习预测转换参数来形成形变场。
Balakrishnan 等人[8]使用了类似U-Net [9]的CNN 来获取形变场,并将该算法命名为VoxelMorph,其配准速度和精度都有着可观的提升,在医学图像配准领域得到了广泛的认可。
然而VoxelMorph 在编解码结构处仍然使用的是类似于U-Net 的长连接方式, 相连接的两个特征图可能存在较大的语义差距,影响后续配准精度。
基于此,本文提出了基于深度学习的无监督单模态医学图像配准算法,在U-Net 的基础上部署了短连接方式,与原有的长连接方式相结合,既保留长连接表征距离较远的特征之间关系的优点,也克服了相连接的特征之间语义差距较大的缺点。本文也在U 型网络的解码器上设计了通道注意力机制,进一步