首站-论文投稿智能助手
典型文献
一种基于加权深度森林的离群数据挖掘算法
文献摘要:
深度森林是一种有效的机器学习方法,但在级联森林模块中,森林中子树的特征选择随机性较大,使用传统的平均值法可能导致森林的预测概率存在一定误差,从而影响整个算法性能.针对以上问题,提出了一种基于加权深度森林离群数据挖掘算法(Weight Deep Forest,WDF).首先,通过森林的预测概率定义权重因子μ,描述当前层森林准确率大小;其次,在级联森林模块的构建过程中,把权重因子μ作为级联层中每个森林的权重,从而降低森林中根节点特征的随机选择对算法性能的影响;根据数据样本分布的不同,通过计算其类密度重新定义了局部孤立因子α,描述数据离群程度大小;最后利用UCI数据集以及LAMOST光谱数据对算法进行验证,结果表明该算法与同类算法相比在离群点检测方面具有更高的挖掘质量.
文献关键词:
深度森林;级联森林;权重因子;孤立因子;离群挖掘
作者姓名:
李瑞峰;杨海峰;蔡江辉;荀亚玲;周永祥
作者机构:
太原科技大学 计算机科学与技术学院,太原030024
引用格式:
[1]李瑞峰;杨海峰;蔡江辉;荀亚玲;周永祥-.一种基于加权深度森林的离群数据挖掘算法)[J].小型微型计算机系统,2022(07):1426-1431
A类:
孤立因子,离群挖掘
B类:
深度森林,离群数据,数据挖掘算法,机器学习方法,级联森林,林中,中子,特征选择,随机性,平均值法,算法性能,Weight,Deep,Forest,WDF,率定,权重因子,构建过程,根节点,节点特征,随机选择,样本分布,重新定义,UCI,LAMOST,光谱数据,离群点检测
AB值:
0.349052
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。