肺癌在各项肺部疾病中是非常致命的,而早期的诊断和治疗则能够有效的降低死亡率,对于早期的预防以及诊断,肺结节分割是一个非常重要的步骤,但结节与其领域之间的相似性难以处理。在这里本文提出了一个端到端的基于UNet的分割框架,称为PR-Net。为了保证标准卷积的可接受精度以及深层结构带来的信息损失,本文构建了残差结构的变体作为网络的主干。此外在解码过程中由于信息的冗余和语义差距导致难以有效的融合病变区域的空间及语义信息,为此本文采用了Transformer中的注意力机制,通过该机制的多头自注意力来有效提升空间细节和语义定位级别的特征识别。最终的模型IOU指标达到了97.71%,Dice相似系数达到了98.84%。大量的实验和结果表明,本文的模型在肺结节分割上有着非常不错的性能及稳定性。
肺部CT 图像分割是疾病检测等许多应用中的关键过程。由于肺部结构中存在相似的图像密度、不同类型的扫描仪和扫描协议,这被认为是一个具有挑战性的问题[1]。在各种肺部疾病中,肺癌是最致命的,根据世界卫生组织(WHO)的数据,肺癌每年造成全球130 万人死亡。早期治疗可降低死亡率,对于预防和诊断病变,肺结节分割[2]是一个重要步骤。诊断的第一部分是计算机辅助诊断(CAD)系统,该系统改进了结节的检测,有助于将结节分为恶性或良性。然而,随着时间的推移,数据不断扩大,CT 图像的数量也在增加。随着图像数量的增加,采用手动肺结节分割程序变得具有挑战性。考虑到这一问题, 一种高效的肺结节自动分割算法在临床上具有重要的意义。
最近,基于深度学习的框架已应用于许多医学图像处理领域,包括医学图像分割、病变检测和分类。
根据这些成功的经验, 已经提出了许多用于CT 图像分割的深度学习系统[3] [4] [5] [6]。
众所周知的UNet [7]及其变体, 包括UNet++ [8]、V-Net [9], 已被作为一些早期但有效的尝试, 用于从CT 扫描中分割肺部[10]、肺部阴影[11]和病变区域[12]。继它们工作之后Maqsood 等人提出了一种端到端基于U-Net 的分割框架(DA-Net)用于有效的肺结节分割,该方法通过集成与Atrous 卷积块合并的紧密和密集链接的丰富卷积块来提取丰富的特征, 以在不丢失和覆盖数据的情况下拓宽滤波器的视野[13]。
Luo 等人针对肺结节表面详细信息学习不足以及模型参数和计算过多的问题,提出了一种3D 双注意力阴影网络(DAS-Net)来解决肺结节的准确分割问题[14]。
提出了深度学习和形状驱动水平集的协同组合, 以实现自动化和准确的肺结节分割[15]。
2. PR-Net 分割模型 2.1. 模型结构 提议的PR-Net 模型结构主要由三个部分构成,分别是编码器部分、解码器部分以及特征增强部分。
详细的模型结构如图1 所示。编码器部分由改进的残差块和平均池化下采样构成,通过不断地压缩原始图像从而逐步提取富含高级语义信息的特征图,但随着网络层数的加深,可能会出现梯度消失甚至梯度