在许多疾病的病理学诊断中,细胞核的形状、特征的变化是病变发生与否的重要依据,利用计算机智能分割出病理组织切片中的细胞核能为疾病诊断提供更多的参考。本研究将卷积神经网络应用在乳腺癌病理组织切片图像中的细胞核分割上。在对图像进行光学预处理后,将其分割成多个小图像输入到改进的Alexnet模型中对模型进行训练,使其能自动识别细胞核特征。随后,将训练后的模型用于测试集图像的细胞核分割中,把图像分割成多个小图像让模型并行处理,并最终整合所有的输出结果生成一张完整的细胞核分割图,达到细胞核分割的目的。结果表明,模型对训练集中的细胞核识别率达到92%,训练后的模型对人工标记图像中并没有标记出来的细胞核都能准确地识别出来,表明模型已成功的学习到细胞核的主要特征。最后,对测试集图片进行分割的结果显示,训练后的模型成功地把病理组织切片图像中的细胞核准确且快速地分割出来,证明这种切分图像进行细胞核分割最后再整合的方法在保证准确性的同时也能提高计算效率。
细胞核的病变是许多疾病发生的重要标志之一,尤其是癌症,癌细胞的细胞核较正常细胞有着明显的区别,因此细胞核的性状常常作为病理学诊断的一个重要依据[1]。近年来,深度学习算法的发展使得计算机辅助诊断技术的应用能力有了较大的提高,而如何将细胞核这一重要特征既精确又高效地从一些病理学组织切片中分割出来已成为该领域极具挑战的一个重要课题[2]。
针对细胞核分割技术,国内外的学者都提出了不少模型。项磊与徐军[4]使用方向梯度直方图(Histogram of Oriented Gradient, HOG)以及滑动窗口技术,搭建softmax 分类器、HOG 以及支持向量机SVM(Support Vector Machine, SVM)等多个模型,以达到对乳腺癌病理切片图像进行细胞检测,其中HOG+SVM 模型的准确率达到了71.5%。此外,张敏淑[5]针对白细胞图像的特征提取问题,提出了一个基于阈值分割算法的白细胞定位并提取细胞核特征的模型,并利用大律法进一步排除图片其余成分对细胞核检测的干扰,取得了较好的成果,但存在着将细胞核与淋巴细胞混淆的情况。虽然这些研究都对细胞核分割进行了较深入的探讨,但仍存在着正确率较低或精度较差等问题,因此相关研究开始将目光转向深度学习算法。2016 年,Xu 等[6]提出了基于堆叠稀疏自编码器(Stacked Sparse Autoencoder, SSAE)的乳腺癌细胞细胞核检测模型,结果发现模型对细胞核的识别率达88.84%。随后,Win 等人[7]利用全连接卷积神经网络对细胞学胸腔积液图像进行细胞核分割,并进一步运用形态学运算以及分水岭算法,分割出整个细胞,正确率达到了92%。尽管这些模型的识别率较高,但由于其计算量庞大而使得处理一张图像要耗费较长时间,极不适合实际应用。
本研究针对上述问题,采用切分图像的方法将较大的图像分割成多个小图像,随后根据这些小图像的特点改进经典的卷积神经网络结构Alexnet 并进行训练,使得训练后的模型能识别出图像中的细胞核,