首站-论文投稿智能助手
典型文献
一种改进密度峰值聚类的欠采样算法
文献摘要:
不平衡数据越来越多地出现在各个领域,而传统机器学习分类算法往往会忽略少数类样本的分类精度,针对此问题,提出一种基于密度峰值聚类改进的欠采样算法.该算法利用信息熵对密度峰值聚类算法进行优化,获取最优截断距离;选取密度距离较大的点作为聚类中心并选取所有聚类中心代表整个多数类数据集.将该文算法与几种欠采样算法进行对比实验,结果表明,该方法有效提高了不平衡数据集中少数类的预测精度.
文献关键词:
数据挖掘;不平衡数据;欠采样;密度峰值聚类
作者姓名:
李鑫
作者机构:
首都经济贸易大学,北京 100026
文献出处:
引用格式:
[1]李鑫-.一种改进密度峰值聚类的欠采样算法)[J].现代信息科技,2022(18):81-83,88
A类:
B类:
欠采样,采样算法,机器学习分类算法,少数类,分类精度,基于密度,法利,信息熵,密度峰值聚类算法,截断距离,度距离,聚类中心,不平衡数据集
AB值:
0.231804
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。