基于ARIMA和LSTM的网络流量预测研究

发布日期:2020年10月28日
基于ARIMA和LSTM的网络流量预测研究 基于ARIMA和LSTM的网络流量预测研究

本内容试读结束

下载后可阅读完整内容,立即下载

网络流量预测是网络安全领域重要的研究方向之一,精准预测网络流量的趋势和峰值,并针对现有信息安全系统发现网络中可能存在的安全问题做出提前预警。随着各传感器的大量部署,系统已拥有大量可用数据,但是缺乏行之有效的分析方法,为此本文通过深度学习的方式对网络流量预测建立模型,提出一种基于LSTM神经网络的流量预测模型,并与ARIMA模型比较验证LSTM网络模型具有更好的性能,验证了该模型在网络流量预测中的适用性与更高的准确性。

随着网络技术的高速发展和互联网技术的普及, 网络已经成为人们工作、生活必不可缺的一部分[1]。

传统的网络流量预测主要凭借主观经验,根据历史数据和个人经验进行流量的预测判断,该类方法误判的几率较大,不能够对流量变化趋势做出准确判断,预测结果较实际数据存在明显偏差。如果基于大量历史数据并且实时掌握目前网络状况,进行流量预测,其结果会更加可靠,因此提出了网络流量预测分析模型。

近年来,许多流量预测模型被提出,其中包括统计与回归方法[2],基于流量的方法[3]和机器学习方法[4]。目前被广泛认可的自回归积分滑动平均模型(Autoregressive integrated moving average model,简称ARIMA), 已于20 世纪70 年代应用在网络安全领域, 目的是预测网络系统的状况, 并且逐渐成为新的预测模型的比较对象。ARIMA 在数据规则变化时表现出良好性能,但是当数据不规则变化时,预测的误差较大。同时随着计算性能逐渐提高,传感器技术的成熟,能够感知采集大量数据,由此引发的“数据爆炸”的问题越来越受到重视,传统的方法由于维度的局限性难以适应现在预测需求,因此目前急需新的处理大数据的预测模型。

上述研究方法虽然能初步地解决流量预测的问题,但是没有考虑到内部深层细粒度特征。随着机器学习技术的发展,深度学习以其强大的特征提取能力,基于深度学习的预测模型逐渐成为新趋势。到目前为止,深度学习技术已经在自然语言处理、语音识别和计算机视觉领域取得显著成功,并向其他领域应用广泛扩展,其中时间序列分析为新的扩展方向之一。网络流量预测分析可以抽象成时间序列问题, 目前循环神经网络模型(Recurrent neural network,简称RNN)被广泛认可,但是根据以往研究表明,传统的RNN 方法性能难以满足需求, 对10 分钟后的数据难以预测, 为此本文提出将长短期记忆网络模型(Long short-term memory,简称LSTM)用于网络流量的预测,该方法具有较高的准确性,与ARIMA 模型对比性能提高近70%。

2. 流量预测 流量预测作为网络安全的重要研究方向之一可以抽象为时间序列预测问题,时间序列预测虽然作为机器学习的重要领域之一,但与其它机器学习问题不同,关键区别在于固定的数据序列约束以及提供的约束条件。时间序列预测问题涉及许多时间分量,而这往往是问题解决的难点,并且不能简单地使用机器学习算法解决。时间序列预测为根据当前和过去采集到的数据,分析预测出未来几分钟到几个小时的可能状况。此类问题与网络流量预测问题、交通预测问题十分类似,两类都可以归结为时间序列预测的



相关标签