由于人脑的结构比较复杂,所以如何准确的提取分割部位的特征是医学图像语义分割的一个关键点。本文使用Unet 网络作为基本框架,并在特征提取过程中引入了注意力机制CBAM ,在Unet 的Skip-connection过程中引入了SENet。通过这些方法从全局增强分割部位的语义信息并降低其他部位的语义信息。本文使用相同的设备和数据分别在Unet、Unet + CBAM、Unet + SENet以及本文提出的模型进行了实验,得到对应的平均Dice分别对应为0.680、0.703、0.706、0.736。实验表明,本文提出的方法对阿尔兹海默症病灶分割的性能有显著提升。
阿尔兹海默症(Alzheimer’s Disease, AD)是一种以记忆功能和认知功能进行性退化为特征的临床综合征,是导致痴呆症的主要原因,也是导致人类死亡的一大原因。AD 的潜伏期较长,其临床表现也会随着时间的推移而慢慢恶化,它通常隐匿起病,持续进行性发展,临床上表现为记忆障碍、失语、失用、失认以及视空间能力损害等一系列认知功能减退和非认知性神经精神症状[1],而要在相关症状出现之前准确诊断患病风险并不容易。
磁共振成像(MRI)是医学专业人员用来诊断神经和脑相关疾病的重要工具。
由于它具有非侵入性、可以提供高空间分辨率的图像等特点,成为了脑结构分析的首选方法。研究发现, 阿尔兹海默患者的海马体、颞叶以及额叶等部位会比正常衰老的老人萎缩的程度更大。所以,如果我们可以很直接的观测到这些组织,那么对于医生的临床诊断将会有很大的帮助。
常用的医学图像分割方法可以分为传统型的和深度学习型的,传统型的有随机森林(Random Forest, RF)、遗传算法(Genetic Algorithm, GA)、支持向量机(Support Vector Machines, SVM)等方法。深度学习的主要有编码–解码器、模型压缩、注意力机制、图像合成等方法。
而随着近些年对深度学习研究的加深, 越来越多的学者使用深度学习的方法对医学图像的语义分割展开研究。由于每种方法对解决的问题具有一定的针对性,所以对每种方法的评价都需要结合实际需要解决的问题来进行。而我们的工作是分割阿尔兹海默症患者的脑MRI 图像,针对已有的数据集特点以及脑部结构的复杂性,上述的这些方法要么在处理复杂的不连续结构中难以获得满意的效果,要么就是只能进行单个病灶的识别,很难达到一个令人满意的效果。因此,在现有的MRI 图像分析方法中应该进一步关注如何对医学图像这样一个特殊的数据进行特征提取,如何对脑部这样一个复杂的环境进行分析,如何使用少量的带标注的数据集也能有一个很好的效果,这些都是我们所要考虑的问题。
针对脑部医学图像的特征,本文提出了一种以Unet 为基础适用于阿尔兹海默病灶分割的模型。本文的主要贡献有以下两点: 1) 本文将注意力机制运用在特征提取的过程中,改善了因脑部图像结构复杂,目标体积小,而导致特征提取性能低的问题。
2) 本文在跳跃连接过程中引入了SENet 进行处理后再进行连接, 用以增强低层语义和高层语义的连接效果。并使模型可以更好的进行多尺度预测和为分割提供更加精细的特征。
2. 相关工作 卷积神经网络(Convolutional Neural Networks, CNN)在图像分割、预测和分类等应用中得到了广泛的应用。
Long 等人在2015 年时提出了一种用于像素级别标记的完全卷积神经网络模型(FCN)新的分割模型