乳腺癌病理图像的自动分类是开发乳腺癌计算机辅助诊断系统的关键。针对乳腺肿瘤病理图像的特点,提出了一种基于LBP原型的特征提取方法,首先,随机地从训练图像中选取若干子图像作为原型并提取其LBP特征;其次,对于任意输入图像,计算图像中所有和原型同样大小的子图像和原型的LBP特征的余弦距离,然后,通过池化操作得到最终的特征;最后,利用SVM集成的方法对图像进行分类。在BreakHis数据集上对算法进行了验证,结果表明,本文提出的特征提取方法优于一些传统的方法。
乳腺癌(Breast Cancer, BC)是全世界女性发病率和死亡率最高的癌症,而组织病理学分析是最可靠的癌症诊断方法[1] [2] [3]。组织病理学分析是一项高度耗时的专业工作,通常是需要由病理学专家对乳腺癌组织病理学(Breast Cancer Histopathological, BCH)图像进行观察,根据经验来判断肿瘤是良性还是恶性, 或者说对BCH 图像人工进行分类, 它十分依赖于病理学家的经验, 并且难以避免病理学专家受到疲劳和注意力下降等因素的影响造成误诊。在此背景下,迫切需要相应的计算机辅助诊断来减轻病理学专家的工作负担,其中BCH 图像分类在计算机辅助诊断中具有重要意义[2]。
BCH图像分类已经成为医学图像分类领域上的一个研究热点, 目前已经有很多学者对此进行了研究。
目前关于BCH 图像分类算法可以分为两大类:基于传统机器学习的分类算法和基于深度学习的分类算法。
基于传统机器学习的分类算法步骤为:预处理[4] [5] [6] [7]、特征抽取和选择[8] [9] [10] [11]、分类[11] [12] [13]。其中特征提取和选择、分类是图像分类中的关键。Spanhol 等[11]将LBP (Local Binary Pattern,局部二值模式)、CLBP、LPQ、GLCM、ORB 和PFTAS 等特征,分别与SVM,RF,QDA,Nearest Neigbor分类器相结合用于BCH 图像良恶性分类。Vibha Gupta 等[13]提出了一种将Gabor、OCLBP、颜色、纹理等多种特征融合,并采用投票机制的异构集成分类器对BCH 图像进行分类的方法。Shukla K. K.等[14]提出了利用形态学特征对BCH 图像进行自动检测和分类的方法, 使用直方图均衡化改善图像的局部对比度,采用TWS 进行分割,并对MLP,LMT,RF,Rotation Forest,SMO,Naïve Bayes,J-Rip 和PART等多种分类器进行了比较研究。
由于深度学习的发展, 越来越多的文献使用深度学习的方法对BCH 图像分类。Pimkin [15]等人采用卷积神经网络(CNN)架构来进行BCH 图像分析,提出对图像小块进行分类以增加有效样本的数量,然后应用集成技术对原始图像进行预测。Marami [16]等人提出一种集成了4 个改进的incepin-v3 神经网络的自动分类方法。
而Spanhol [8]等人提出了一种基于提取图像小块来训练CNN, 然后将这些小块结合起来进行最终分类的方法。
虽然人们已经对BCH 图像分类进行了很多的研究, 但是, 现有的识别方法正确率还不能满足实际应用的要求。究其原因,在有关BCH 图像分类的文献中所使用的很多特征提取方法,其中,Gabor、LBP、CLBP、LPQ 等特征主要应用于人脸识别等应用场合, 为了得到好的识别结果, 首先要将人脸区域分割出来, 使得每幅图只包含一个人脸, 并且要通过归一化处理使得不同图像中的关键部位(如眼睛、鼻子)尽量