典型文献
基于多机器学习模型的逐小时PM2.5浓度预测对比
文献摘要:
[目的]比较分析XGBoost模型、LightGBM模型、随机森林模型(RF)、K最近邻模型(KNN)、长短期记忆神经网络(LSTM)、决策树模型(DT)共6个PM2.5浓度预测模型,以准确、及时预测环境PM2.5浓度.[方法]基于重庆市合川区2020年全年空气质量监测数据和气象数据,通过最大相关最小冗余算法(MRMR)进行数据降维选择最优特征子集,作为模型的输入,逐一进行PM2.5浓度预测;考虑到不同季节PM2.5浓度差异较大,故分季节预测了 PM2.5浓度;为了探究各模型预测性能,计算了各模型运行时间和内存占用,并基于PM2.5与特征变量的相关性和特征变量的重要性探讨了模型预测性能季节性差异原因.[结果]模型总体预测精度从高到低排序为XG-Boost、RF、LightGBM、LSTM、KNN、DT模型;预测性能方面,6个模型均表现为秋冬季节预测精度高于春夏季节;LightGBM模型可在保证模型精度的情况下,大幅减少模型训练时间和内存占用;特征重要性显示PM10浓度、气温和气压的重要性高,03浓度、风向和NO2浓度重要性相对较弱.[结论]采取MRMR方法进行数据降维选取的最优特征子集能较好地预测PM2.5浓度;相比较而言,XGBoost、RF、LightGBM、LSTM模型在PM2.5浓度预测上具有较优性能,其中综合性能较好的为LightGBM模型.
文献关键词:
PM2.5预测;机器学习;最大相关最小冗余(MRMR);气象因子
中图分类号:
作者姓名:
陈建坤;牟凤云;张用川;田甜;王俊秀
作者机构:
重庆交通大学智慧城市学院,重庆 400074
文献出处:
引用格式:
[1]陈建坤;牟凤云;张用川;田甜;王俊秀-.基于多机器学习模型的逐小时PM2.5浓度预测对比)[J].南京林业大学学报(自然科学版),2022(05):152-160
A类:
B类:
多机器学习,机器学习模型,PM2,浓度预测,XGBoost,LightGBM,随机森林模型,RF,最近邻,KNN,长短期记忆神经网络,决策树模型,DT,合川区,空气质量监测,气象数据,最大相关最小冗余,MRMR,数据降维,优特,特征子集,不同季节,分季,季节预测,预测性能,运行时间,内存占用,特征变量,重要性探讨,季节性差异,差异原因,秋冬季节,春夏季,模型精度,模型训练,训练时间,特征重要性,PM10,NO2,比较而言,气象因子
AB值:
0.326813
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。