典型文献
概率密度函数的自适应过采样算法研究
文献摘要:
针对传统的过采样算法中决策边界模糊以及噪声样本分布问题,本文提出一种基于概率密度函数与自适应过采样算法.首先将少数类样本分为安全样本、边界样本、噪声样本;然后采用瑞利分布(Rayleigh Distribution),对安全样本及边界样本进行采样操作,利用其概率密度函数对新样本的分布密度进行构造,以此达到平衡数据集的目的 ;最后使用随机森林作为分类器,并进行网格搜索(Gridsearch)进行参数寻优.实验结果将所提出的方法与4种代表性算法在10个不均衡数据集上进行了比较,验证了该算法的有效性.
文献关键词:
不均衡数据;过采样技术;瑞利分布;随机森林;分类
中图分类号:
作者姓名:
张忠林;傅添翼;闫光辉
作者机构:
兰州交通大学电子与信息工程学院,兰州730070
文献出处:
引用格式:
[1]张忠林;傅添翼;闫光辉-.概率密度函数的自适应过采样算法研究)[J].小型微型计算机系统,2022(03):514-519
A类:
Gridsearch
B类:
概率密度函数,采样算法,算法研究,决策边界,边界模糊,样本分布,少数类,瑞利分布,Rayleigh,Distribution,分布密度,平衡数据集,分类器,网格搜索,参数寻优,不均衡数据集,过采样技术
AB值:
0.317642
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。