多尺度融合编码与自注意力的肺部CT分割算法

发布日期:2023年9月18日
多尺度融合编码与自注意力的肺部CT分割算法 多尺度融合编码与自注意力的肺部CT分割算法

本内容试读结束

下载后可阅读完整内容,立即下载

计算机断层扫描(CT)在当前是一种辅助检测肺炎的有效手段,但病理表征的复杂性给医生诊断时带来不便,难以准确地对图像进行分割。为进一步辅助医生根据病理表征诊断病情,本文基于U-net提出了一种多尺度融合编码网络,并结合自注意力机制,力图在辅助医生判断的角度提供可行性方案。为了获取不同尺度的语义信息,首先在编码器部分设计了一种多尺度融合编码器模块,提取不同尺度的特征,充分感知语义信息;同时在编码器和解码器之间的跳连部分引入了改进的自注意力机制,使得网络更好地关注不同语义特征的相关性;最后,采用融合Dice损失函数,Focal损失函数,交叉熵损失函数构建的多级损失函数,更好地约束训练。通过训练公开的数据集,得到分割结果表明Dice相似系数、精确率(Precision)、召回率(Recall)分别为75.37%、77.03%、71.87%,优于其他的模型。我们验证了改进的网络能够在图像分割过程中提升网络性能的可能性。

目前为止,全球累计肺炎确诊病例突破4 亿例,累计死亡病例超600 万[1]。目前主要的肺炎筛查方法是逆转录聚合酶链反应(RT-PCR) [2],但最近研究表明,RT-PCR 敏感性不够高,导致RT-PCR 筛查肺炎的阳性率并不十分理想,有时并不能满足临床的需要。在这种情况下,可以采用断层扫描(computed tomography, CT)和磁共振成像(magnetic resonance imaging, MRI) [3]检测来进一步诊断患者是否患病,一般情况下,医生可以通过患者的CT 影像图来判断病人是否感染肺炎[4]。最近研究表明,胸部CT 对于分析肺炎的敏感度高达0.97 [5],非常有利于肺炎的筛查,但是CT 扫描费时低效,还需要专业医生进行辅助判断,需要耗费巨大的人力财力。

随着语义分割技术的快速发展,不同的神经网络模型在医疗影像领域中也得到了广泛应用,卷积神经网络的(Convolutional Neural Network, CNN)成功应用于图像分割领域[6],为图像特征提取提供了全新的解决方法。2015 年Long 等[7]提出了全卷积网络(Fully Convolutional Network, FCN),使用卷积层替换全连接层,使图像达到像素级分类,从而实现语义级别的分割效果。Ronneberger 等[8]提出了U-Net,采用了编码器–解码器的结构,编码器通过卷积与池化操作对输入图像进行下采样编码,解码器通过上采样操作将编码特征映射成掩模图,得到语义分割结果。Zhou 等人[9]受U-Net 启发提出了U-Net++模型, 通过增加编码器与解码器之间的细粒度信息重新设计了跳连模块。

与FCN 相比U-Net 作为骨干网络分割



相关标签