首站-论文投稿智能助手
典型文献
红外光谱数据集划分比例及预处理方法研究
文献摘要:
血红蛋白浓度是人体的一项重要生理指标,其异常将导致多种疾病.近红外光谱分析技术可以快速、无试剂检测人体中血红蛋白的含量.但是,红外光谱重叠严重、有效信息弱、易受外界噪声干扰,因此通常需要对光谱数据进行数据集划分和预处理,建立定量模型,以去除干扰信息对预测模型的不良影响.如何选择最佳划分方法、最佳划分比例和最佳预处理方法仍是一个问题.针对此问题,本研究以190份不同浓度血红蛋白血液样本和150份不同浓度血红蛋白仿体溶液样本的近红外光谱数据为研究对象,研究等间隔划分法、K_S法(Kennard Stone)、SPXY法(Sample set partitioning based on joint x-y distances method)以及双向算法(Duplex)在41种不同划分比例下偏最小二乘(Partial least squares,PLS)模型的预测能力;将小波变换(Wavelet transform,WT)、标准正态变量变换(Standard normal variate,SNV)、直接正交信号校正(Direct orthogonal signal correction,DOSC)、S_G(Savitzky Golay)一阶求导这4种单独预处理方法(考虑顺序)组成65种预处理方法组合,研究这65种预处理组合对PLS定量分析模型预测精度的影响.实验结果表明:两种数据集的PLS模型最优数据集划分方法均为SPXY法,血液样本最佳划分比例为0.48,仿体溶液最佳划分比例为0.90.65种预处理方法中,血液样本的最佳预处理组合为S_G1+WT,此时预测集相关系数(Correlation coefficient of prediction set,Rp)为0.9808,预测集均方根误差(Root mean square error of prediction set,RMSEP)为0.2701;仿体溶液样本的最佳预处理组合为SNV+WT,此时Rp为0.9952,RMSEP为3.8154.预处理组合时,两种算法叠加的效果最好.本研究结果为此类光谱数据的处理提供了一种新的思路和方法.
文献关键词:
红外光谱;血红蛋白;划分数据集;预处理方法
作者姓名:
朱思聪;高西娅;张朱珊莹;曹汇敏;郑冬云;张莉;谢勤岚;撒继铭
作者机构:
中南民族大学生物医学工程学院,武汉430074;认知科学国家民委重点实验室,武汉430074;医学信息分析及肿瘤诊疗湖北省重点实验室,武汉430074;武汉理工大学信息工程学院,武汉430070
文献出处:
引用格式:
[1]朱思聪;高西娅;张朱珊莹;曹汇敏;郑冬云;张莉;谢勤岚;撒继铭-.红外光谱数据集划分比例及预处理方法研究)[J].分析化学,2022(09):1415-1424,中插15-中插19
A类:
DOSC,G1+WT,SNV+WT
B类:
光谱数据,数据集划分,预处理方法,血红蛋白浓度,生理指标,近红外光谱分析技术,光谱重叠,有效信息,噪声干扰,立定,定量模型,划分方法,白血,血液样本,Kennard,Stone,SPXY,Sample,set,partitioning,joint,distances,method,Duplex,偏最小二乘,Partial,least,squares,PLS,预测能力,小波变换,Wavelet,transform,标准正态变量变换,Standard,normal,variate,正交信号校正,Direct,orthogonal,signal,correction,Savitzky,Golay,求导,定量分析模型,Correlation,coefficient,prediction,Rp,Root,mean,error,RMSEP,思路和方法,划分数据集
AB值:
0.362162
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。