为解决皮肤病识别领域中数据集类别不平衡、模型复杂度高以及准确率低的问题,提出了一种基于可变形卷积AlexNet与软注意力机制的皮肤病变识别算法。首先,提出改进的可变形卷积AlexNet网络模型,提高模型辨析力的同时,降低了模型的参数量,加快模型的训练和测试效率。然后,在改进的模型中集成了软注意力机制,使模型聚焦于皮肤病的关键特征区域,优化模型的特征提取和识别能力。最后,提出了一种联合损失函数,对焦点损失函数与交叉熵损失函数进行加权,聚焦于困难样本和易出错样本,解决因数据集类别不平衡而导致的网络朝着错误方向收敛的问题。在公开数据集进行实验,主观和客观的实验结果表明,提出算法在七种不同类别的皮肤病识别准确率高于对比算法,具有较强的鲁棒性和泛化能力。
皮肤病是一种常见的疾病,且致癌率极高,目前已经成为了全球性的公共卫生问题。近几十年来, 其发病率和死亡率持续攀升,引起了广泛的关注。在所有皮肤病中,尽管黑色素瘤所占比例仅为5%,但其晚期致死率却高达85% [1]。值得注意的是, 早期发现和诊断可以显著提高大多数皮肤癌类型的治疗效果和患者的生存几率。因此,准确的早期诊断在皮肤癌的治疗策略中占据核心地位,是当前临床和科研领域亟待解决的关键问题[2]。
传统的皮肤病变诊断方法,如ABCD 规则、7 点检查表、Menzies 方法以及CASH 特征等,长久以来辅助皮肤科医生进行临床诊断。然而,这些方法在实际应用中面临着诸多挑战。首先,诊断结果的准确性在很大程度上依赖于皮肤科医生的临床经验,而医生间的诊断水平存在显著差异。此外,手工提取病变特征不仅费时费力,而且难以捕捉到复杂皮肤病变的全部结构特征,严重限制了在处理复杂病例中的效能。
近年来,深度学习成为皮肤病检测的一个理想的解决方案。Medhat 等[3]通过对传统AlexNet 网络结构进行简化,并采用迭代幅度修剪技术,显著降低了模型的参数量和计算资源消耗,从而加速了模型的运行速度;Hoang 等[4]提出了一种结合熵权重(EW)和第一累积矩(FCM)的图像阈值技术,旨在提高分割精度,并通过优化ShuffleNet 网络结构,实现了模型的轻量化,缩短了训练和测试时间;Raghavendra 等[5]设计了一种新型卷积神经网络,通过整合全局平均池化层(GAP)和预处理技术,既轻量化了模型,又提升了其泛化能力。然而,尽管这些方法提高了模型效率和速度,它们在捕获输入图像的关键特征区域方面仍显示出不足,影响了识别的准确性,并且未能有效应对皮肤病种类间的高相似度、类内差异性大以及数据集类别不平衡的问题。Yan 等[6]在VGG-16 网络的基础上进行了简化和改进,通过引入预处理层(CBRM 层)并整合残差学习技术,增强了模型对皮肤病变图像中复杂细节和变化的捕获能力,从而提