在构建医学心电信号分类模型时,现有数据库中正样本和负样本存在类别不平衡的问题,即正常心电数据往往多于异常心电数据,从而导致所构建的模型会产生一定的偏差,影响模型最终的分类结果。利用现有12导联心电诊断数据集构建心电信号分类模型,结合对比学习的方法,在传统网络基础上利用孪生网络结构对模型进行预训练,每条心电信号分别与其对应的正例和反例进行匹配得到样本对,并将孪生网络提取的判别特征用于下游任务进行分类。实验表明,基于对比学习预训练范式能够更好地提取心电信号特征,对于克服心电数据不平衡问题有显著效果,该方法可有效地利用了大量正样本,因此基于孪生网络结构的预训练模型所提取的特征判别性能优于传统特征提取模型。测试集上的准确率达到了96.55%,假阳性率6.91%,漏诊率仅2%。
根据国家心血管病中心2021 年发布的中国心血管健康与疾病年报显示, 我国目前心血管疾病患者达到3.3 亿,心血管疾病已经成为我国慢性病的“主力军”,严重危害国民健康安全,我国2019 年农村、城市心血管病分别占死因的46.74%和44.26%, 并且呈年轻化趋势。
在诊断心血管疾病过程中, 如何预防与诊断有高致死率心血管疾病一直是研究热点。无论心血管疾病的病灶在哪,首先伴随的就是心律失常等问题,最常用的诊断心率失常问题的方法是观察十二导联心电图,来判断波形是否正常,根据心率失常的程度来诊断心血管疾病。在人工智能还未快速发展之前,人工观察是最常用的诊断方式,但由于此方法太过依赖医生个人,诊断水平与个人经验一直是人工方法效率与准确率较低的不稳定因素。在机器学习的发展过程中,对数据进行分析准确率高、效率高的优点使得传统机器学习方法在各领域中都有相当优秀的表现, 在心电数据分类任务中也成为了研究热点。
目前使用较多的机器学习方法有支持向量机、决策树、随机森林等。
Bensaid A M [1]等人利用ID3 诱导的决策树进行分类, 达到了73%的准确率;Li [2]等人使用小波包信息熵、随机森林算法对心电信号五分类,达到了94.61%的准确率;方红帏[3]等人利用基于网格状的支持向量机(support vector machine, SVM)分类方法对ECG 信号进行分类, 最终得到98.01%的准确率。
伴随着深度学习的发展,受传统机器学习过程繁琐、耗费时间的弊端限制,神经网络模型在医学领域的应用也愈发频繁,许诗雨[4]等人使用不平衡ECG 信号分类的嵌套长短时记忆网络(NLSTM)模型, 在MIT-BIHAR 数据库上达到了98.34%的准确率;杨德春[5]等人将改进的深度卷积生成对抗网络用于数据扩充, 将优化的U-Net++用于心电信号识别, 最终得到了98.1%的准确率;Zhang [6]等人使用卷积和长短期记忆网络设计了一个复杂的深度学习网络,最终得到分类准确率达到98.8%。
使用传统神经网络处理多导联心电信号数据时,大多数利用卷积神经网络或者是循环神经网络,其基本目标是为了先提取输入心电信号的特征,然后再进行分类任务。相比于传统机器学习算法,模型复杂性更小且更容易扩展[7],Transformer 网络更加注重时间序列数据的连续性,能够更好地捕捉到数据隐