自2020年以来,新冠疫情的迅速扩散,对全世界的社会经济和公共卫生造成了十分严重的影响。如何快速准确地诊断和预测潜在的新冠病例是当前亟需解决的问题。机器学习技术具有处理大量数据、提高预测准确率等优势,在疫情防控中有广泛应用。本文基于机器学习算法,对疑似新冠人员的预测进行研究。通过随机函数生成有效病例数据,并利用SVM (Support Vector Machine)分类模型对其进行训练,经过多次实验,我们发现该模型能够准确地预测疾病,而且具有较高的可靠性。
新冠病毒以惊人的速度传播,给世界各国的公共卫生和经济带来了严重威胁[1]。在疫情爆发初期, 由于对病毒的认识不足,导致许多潜在病例未能及时被发现和隔离,给疫情的控制带来了极大的困难。
随着疫情的发展和变化,针对新冠疫情的防控策略[2]也在不断地更新和改进。针对疫情而言,做好疑似新冠人员的筛查和诊断是抗疫的重要手段。但传统方法对疑似患者的筛查和诊断都会受到疫情爆发等不同程度的影响,效率或多或少都会下降,因此亟需新的方法来提高疑似病例的筛查和诊断的效率。
机器学习是一门以大量的数据为基础的前沿科学, 其被广泛地运用于各个不同的领域[3] [4], 尤其是在医学和其他研究领域。Vaidya 和王晓丽就曾利用机器学习来研究和预测糖尿病和冠心病的相关信息[5] [6],而且还被证明能够帮助更好地识别和治疗疾病。而在疫情防控中,机器学习技术也具有很大的应用前景,例如任建强[7]等基于机器学习的疫情三步预测模型TSPMGML 预测未来确诊人数和实际感染规模。机器学习算法能够处理大量的数据,从而提高数据分析和预测的准确性,同时还能够自动地调整模型参数,以适应不同的数据集和任务类型。
因此,利用机器学习算法进行疫情预测,可以通过收集大量的疫情数据,发现潜在的疑似病例,并提供科学依据来制定疫情防控策略。本文基于机器学习的算法,采用分类模型中的支持向量机(SVM)分类模型,同时以十折交叉验证法作为验证方法,对疑似新冠的患者实施预测研究。我们利用随机函数生成数据,通过控制相关参数保证数据的合理性,利用分类模型进行训练和测试。
根据实验研究结果分析,此模型能够有效地识别分析疑似新冠患者,在实际中能根据分析结果实施有效措施控制疫情。
2. 支持向量机(SVM)的基本原理 2.1. 分类器的选择 在机器学习中,常用的分类模型有决策树、朴素贝叶斯、支持向量机(SVM)和神经网络等[8]。本文中,使用分类模型中的支持向量机(SVM)作为分类模型。
支持向量机(Support Vector Machine, SVM)成为一项具备强大自适应作用的机制,可以实现高效的数据挖掘和预测,它可以在保证精度的前提下,尽可能地减少实际数据的偏离,从而进一步提高建模的精度。支撑向量机(SVM)成为一项具备自适应作用的机器学习方法,在统计分类、回归等领域得到了普遍的应用。它的一项重要优势在于,可以实现对数据的自动调整,从而减少实际的输入偏离。
SVM,它的核心概念在于通过将复杂的二分类算法,如高维特征空间和一个超平面,有效地划分出