首站-论文投稿智能助手
典型文献
基于机器学习的水体化学需氧量高光谱反演模型对比研究
文献摘要:
化学需氧量(COD)是水体有机污染的一项重要指标,如何快速准确检测水体的COD含量尤为重要.机器学习在水质反演领域应用日益增多,并取得了较多的研究成果,高光谱遥感具有光谱空间分辨率高、成像通道多等优势,使其在水体COD反演方面有着极大的潜力.利用不同的高光谱预处理方法对原始高光谱数据进行处理,并利用处理前后的高光谱数据对比研究了不同机器学习模型、不同高光谱预处理方法对水体COD的反演性能.首先利用ZK-UVIR-I型原位光谱水质在线监测仪在扬州宝带河实地收集了1548组COD和对应的高光谱数据(400~1000 nm)样本,为降低光谱噪音干扰以及消除光谱散射影响,分别使用Savitzky-Golay(SG)平滑、多元散射校正数据(MSC)以及SG平滑结合MSC对原始光谱进行预处理.其次,将样本集随机划分为训练集和测试集,其中训练集占比80%,测试集占比20%.对预处理后的训练集全波段光谱基于线性回归、随机森林(random forest)、AdaBoost、XGBoost四种机器学习方法建立COD高光谱反演模型,并选取了决定系数(R2)、均方根误差(RMSE)、相对分析误差(RPD)三种指标在测试集数据中评估高光谱反演模型的精度.结果表明,随机森林、AdaBoost、XGBoost均优于线性回归,无论光谱处理与否,通过XGBoost建立的反演模型预测能力均为最佳,其中使用XGBoost对经过SG平滑和MSC处理后的光谱数据进行建模的反演模型精度最高,其R2达到0.92,RMSE为7.1 mg·L-1,RPD为3.4.考虑到原始光谱可能存在冗余,通过主成分分析法(PCA)对经过SG平滑和MSC处理后的光谱进行降维,并选取累计贡献率达到95% 的前十个主成分作为模型的输入变量.通过XGBoost建立反演模型,结果表明经过PCA后的反演模型不仅精度有所上升,RPD达到3.8,而且模型的训练时间也由72 s缩短到2.9 s.以上研究可为该水域及类似水域的高光谱水质反演模型的建立提供新的方法及思路.
文献关键词:
化学需氧量;机器学习;高光谱;反演模型对比
作者姓名:
王春玲;史锴源;明星;丛茂勤;刘昕悦;郭文记
作者机构:
北京林业大学信息学院,北京 100083;国家林业和草原局林业智能信息处理工程技术研究中心,北京 100083;中国科学院软件研究所南京软件技术研究院,江苏 南京 210049
引用格式:
[1]王春玲;史锴源;明星;丛茂勤;刘昕悦;郭文记-.基于机器学习的水体化学需氧量高光谱反演模型对比研究)[J].光谱学与光谱分析,2022(08):2353-2358
A类:
反演模型对比,UVIR,水质反演模型
B类:
基于机器学习,化学需氧量,高光谱反演模型,COD,有机污染,快速准确,高光谱遥感,空间分辨率,分辨率高,光谱预处理,预处理方法,高光谱数据,用处,数据对比,机器学习模型,ZK,水质在线监测,在线监测仪,扬州,低光,噪音干扰,光谱散射,射影,Savitzky,Golay,SG,多元散射校正,校正数,MSC,滑结,样本集,训练集,测试集,全波段,random,forest,AdaBoost,XGBoost,机器学习方法,决定系数,RMSE,RPD,光谱处理,预测能力,模型精度,累计贡献,十个,分作,明经,训练时间,水域,似水
AB值:
0.250839
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。