基于遗传算法和正则化极限学习机的PM2.5浓度预测研究

发布日期:2018年8月27日
基于遗传算法和正则化极限学习机的PM2.5浓度预测研究 基于遗传算法和正则化极限学习机的PM2.5浓度预测研究

本内容试读结束

下载后可阅读完整内容,立即下载

环境质量与人们的健康息息相关,一直是研究的热点。本文选取长沙市2017年NO2、PM10等大气数据对PM2.5日均值进行预测,采用BIC准则进行特征选择。在传统的超限学习机(ELM)的基础上,引入正则化项以控制模型的复杂度,并用遗传算法(GA)对模型的输入层权重矩阵和隐含层阈值矩阵进行优化,建立遗传算法和正则化极限学习机(GA-RE-ELM)的PM2.5预测模型。实验表明,该模型相比BP神经网络、超限学习机有更好的精度,均方误差分别降低了35.09%、25.49%,平均绝对误差分别降低了40.86%、30.80%,平均绝对百分误差分别降低了45.49%、31.65%,为PM2.5浓度的预测提供一种新的方法。

空气质量的好坏和人们的健康息息相关, PM2.5 作为衡量空气质量的重要标准, 逐渐引起人们的重视, 进而成为众多学者研究的热点[1]。从国内外近几年的研究状况来看[2],应用数值方法来预测PM2.5 浓度通常需要较详细的排放源时空分布资料和高分辨率的气象模式,但该方法的发展在我国的大部分城市并不成熟[3]。而回归分析[4]、时间序列[5]、贝叶斯网络[6]等广泛应用的空气质量统计预测方法,其预测精度并不能令人满意[7]。随着计算机技术和理论的发展,基于智能原理的人工神经网络、支持向量机模型在PM2.5 浓度的预测中取得了不错的效果[8]。然而,传统的神经网络容易过拟合,隐藏层神经元个数难以确定、寻找结构参数复杂,而且在输入数据较多且具有多重共线性时[2],神经网络模型的训练效率会降低,从而影响空气质量预测的精度。陈绍炜[9],易少强[10],张卫辉[11]等分别提出了各种与极限学习机(ELM)结合的预测模型,在工程问题上取得了一定的效果[12],但这些方法都有可能陷入局部最优。

本文运用BIC 信息准则选择与PM2.5 浓度相关的指标,并结合遗传算法和正则化项,提出了一种基于超限学习机的PM2.5 预测模型(GA-RELM)。该预测模型融合了遗传算法全局寻优和正则化项能控制ELM 模型复杂度,能有效地提高PM2.5 浓度预测的精度,并分析与其有关的指标,为加强环境污染的防控提供有力的参考。

2. 研究方法 2.1. BP 神经网络 误差反向传播算法(BP)解决的了神经网络隐含层连接权值的问题,进而解放了BP 神经网络的应用, 它是至今为止最经典且最成功的学习算法之一。在实际任务中使用神经网络时,大多是用BP 算法进行



相关标签