在各大体育赛事中,球员在比赛中的优势表现往往对比赛的结果至关重要。为了定量化分析势头对各体育赛事的影响,我们将势头概念量化,引入势头得分这一概念,并随机抽取五场网球比赛进行分析,将破发成功率,二发成功率,一发成功率,一发得分率作为影响势头分的指标,通过LASSO回归建立势头得分与各指标的量化关系,考虑到多指标的输入输出,我们引入BP神经网络建立起多指标对输出的关系,并将LASSO回归得到的具体的势头分作为BP神经网络的输出,将BP神经网络残差输出借助LSTM预测,并将二者相加得到较为精准的势头得分,正确率高达95%。结果表明各球员在比赛中的势头在一定程度上影响比赛的结果。
网球作为一项全球性的竞技运动一直以来广泛受到人们的关注。随着时代的变化以及数据科学的发展,以往通过人工观察和分析的方法难以准确评估比赛的结果,因此利用数据分析技术对网球比赛进行客观、全面、深入的分析已经成为了一种必要的趋势和发展方向[1]。本研究将球员在比赛中抽象的势头量化为势头得分, 得分高者取得本场比赛的胜利。
通过LASSO 回归建立势头得分与影响势头得分的各指标之间的关系, 根据回归结果可以对参加比赛的球员提供一些实质性的建议;同时LASSO 回归得到的具体的势头分作为BP 神经网络的输出, 建立起多指标的输出关系, 用LSTM 对BP 神经网络输出残差进行预测,得到较为精准的势头得分。通过势头分的高低判断球员比赛的状态,便于教练在赛场上及时做出决策,以此提升选手的表现,取得更优异的成绩。
2. 数据预处理 通过澳大利亚网球公开赛官网搜集球员比赛的指标, 查阅相关文献后选定指标如下:ACE、破发率、非受迫性失误、一发成功率、一发得分率、二发成功率和双误,共七个变量,构建出如图1 的三级指标体系。
为验证各指标之间的关联性,我们选取了2023 年温布尔登男单决赛中五组比赛数据,对各指标进行斯皮尔曼相关系数的相关性检验,我们得到如图2 所示的热图。
从图2 中发现,这几个指标的相关性都很强,故将这七个指标作为衡量球员表现的重要因子。
介于三级指标体系中各指标大多数为定性变量,为方便后续计算与模型的建立,我们对部分指标进行量化,我们定义: 在每盘网球比赛中: 一发成功率 = 一发的个数/发球总数 一发得分率 = 一发得分数/一发个数