基于DLR模型的PM10–能见度–湿度相关性研究

发布日期:2020年12月30日
基于DLR模型的PM10–能见度–湿度相关性研究 基于DLR模型的PM10–能见度–湿度相关性研究

本内容试读结束

下载后可阅读完整内容,立即下载

针对当前大数据在单机运算时间过长,对硬件设备要求高的问题,为此提出基于云环境下使用分布式逻辑回归算法DLR (Distributed Logistic Regression)模型对PM10与能见度以及湿度之间的相关性问题,根据二分类思想,将能见度、湿度作为特征值,PM10作为标签值使用逻辑回归算法构建模型对其进行分析,实验结果表明,在同一湿度范围下能见度值越小,大气气溶胶PM10浓度偏大,在同一能见度范围下湿度值越大,大气气溶胶PM10浓度偏低。并且DLR算法模型在时间性能方面要优于传统回归模型,具有更好的鲁棒性以及实时性。

在目前的研究中, 经常使用数学领域中的统计学方法对湿度、大气能见度与气溶胶PM10 进行研究, 如文献[1]用标准化降水指数作为为干旱指标,分析贵州省年度和季节的干旱发生频率的变化特征;刘艳萍等[2]应用统计学和Arc GIS 软件分析中国四大工业基地主要城市大气颗粒物污染的时间及空间分布特征,并利用SPSS 软件对大气污染物PM10、SO2、NO2、CO、O3 和PM2.5 的相关性进行分析;文献[3]分析显示PM10 浓度增大以及颗粒物吸湿性增长可导致能见度数值降低。但这类方法存在人为影响的客观因素。近年来,更多的学者寻找其他的替代方法。20 世纪80 年代以来人工智能领域兴起,人工神经网络成为研究的热点。石灵芝等人提出基于BP 人工神经网络[4]的大气颗粒物PM10 质量浓度预测,建立人工神经网络模型捕捉污染物浓度与气象因素间的非线性影响规律,能够准确预测大气PM10 质量浓度的实时变化。

D. K. Papanastasiou 等人提出使用神经网络[5]和多元回归模型[5]以预测一个中型的地中海城市PM10 水平,两个模型都能够较好的预测PM10 实时日均值。

然而,气象领域在处理气象数据的问题上使用的多是投入耗费大的传统方法。对于硬件设备的要求过高,普通的单机运算已经无法满足大数据时代的要求。云计算,一种按量付费模式,融合了分布式计算、并行计算、网络存储等技术的新型产物。能够方便、快速、按需分配的完成客户端的运算任务。云计算的低成本运算快让更多研究者用这种方法解决大数据的运算问题。郑湃等[6]提出云计算环境下面向数据密集型应用的数据布局策略与方法,介绍了一种三阶段数据布局策略以解决跨数据中心数据传输、数据依赖关系和全局负载均衡三个问题,实验分析所提出的方法在时间性能上得到有效提高。王晓燕等[7]提出基于云计算环境中面向OLTP 应用的数据分布研究,提出以数据分片、数据分片和负载执行为变量对基于计算环境中大数据OLTP 应用的数据分布问题进行详细归纳分析。张石磊/武装提出一种基于Hadoop 云计算平台的聚类算法优化的研究[8], 对首先选定初始聚类中心的并行K-means 聚类算法进行相关实验验证优化后的算法在时间性能上更优。在气象数据方面,云计算技术也有相应的研究。如潘吴斌



相关标签