多种数据补全策略对商超客流量预测影响研究

发布日期:2023年12月29日
多种数据补全策略对商超客流量预测影响研究 多种数据补全策略对商超客流量预测影响研究

本内容试读结束

下载后可阅读完整内容,立即下载

数据的准确性对传统线下零售商超的客流量预测有着较为显著的影响。通过对某商超2021年的客流量分析发现,受ERP系统不稳定的影响,传统线下零售商超的客流量曾出现了明显的波动,在2021年3月初到2021年7月末,客流量数据出现了断崖式下降。因此在进行客流量预测时,应当针对数据不稳定性对数据进行一定的特征工程处理。为了探究不同特征工程对客流量预测的影响,我们提出了采用删除异常值、Arima模型填充异常值、Mean-Value填充异常值等多种特征工程处理异常值的方式;使用SArima模型、Holt-Winters模型。在多轮实验中,实验训练集将包含2021年3月初到2021年7月末。并且时间序列模型的参数将以数据为准,选择最优参数进行训练,最终实验生成的模型都将使用2021年8月1日至2021年8月31日的数据做预测验证。结果显示,当不使用任何数据补充的特征工程策略时,Holt-Winters模型较好,而使用了数据补全策略后,SArima模型的预测能力得到了显著提升,并且使用Arima模型进行的数据填充,在一定程度上可以提高SArima模型的预测能力。

由于传统线下零售商超的数字化、信息化能力不足,因此ERP 系统中的存在大量的沉睡数据。如何科学合理的刺激市场经济,满足市场需求,增强经济增长的内生动力,为市场主体的发展营造更好的环境,是企业的重要战略。为了应对多变的市场变化,制定合理的零售策略,我们将通过对客流量进行预测分析[1],并充分考虑老旧ERP 系统不稳定因素的影响,除了采用常用的均值、去除空值等方式来对数据的异常值进行预处理外[2],我们还使用Arima 时间预测模型对实验数据进行异常值补全,最后利用、SArima 模型、Holt-Winters 模型进行客流量的预测。本文旨在研究多种数据补全策略对商超客流量预测的影响。Arima 模型时常用的时间预测模型,可以用作短期数据补全。SArima 模型和Holt-Winters 模型是时间序列中常用的预测模型[3] [4]。

对客流量的预测具有一定的应用研究价值。

本研究提出了基于多种数据补全策略特征工程的SArima 模型和Holt-Winters 模型, 并利用2021 年2 月至2021 年4 月某商超线下实际客流量进行了模型训练和预测,来预测多种数据补全策略对商超客流量的影响[5]。同时我们还进行了对比研究与误差分析,以评估模型的准确性和实用性。

总体而言,本文的研究为预测商超购物客流量提供了有效的理论依据与可行的方法。通过使用多种数据补全策略对数据进行预处理;引入不同的模型,使我们能够更加精准的预测商超客流量,为企业的下一步规划,提供了强有力的理论依据,让数据发声,用数据说话。该研究对于零售行业的销售预测、



相关标签