首站-论文投稿智能助手
典型文献
基于SCFSO-MD算法的DNA微阵列数据分类方法
文献摘要:
针对DNA微阵列数据高维、类别不平衡的特点,为提高分类准确性,提出一种基于谱聚类特征选择与闵可夫斯基度量相结合的过采样算法SCFSO-MD.该算法使用谱聚类对特征进行聚类,分别定义特征区分度和特征独立性,并将二者的乘积作为特征子簇中代表性特征的选择依据以构造特征子集,特征区分度使用特征标准差度量,特征独立性使用斯皮尔曼系数度量,同时在SMOTE过采样中分别使用不同阶数下的闵可夫斯基距离度量方法计算K近邻样本.实验结果表明,SCFSO-MD-S算法在SRBCT、Leukemia、Colon Tumor和Ovarian Cancer数据集上的F-value值分别最高可达0.99、0.95、0.90和0.97.当最优特征子集数量仍旧较大时,基于曼哈顿距离度量的SMOTE算法效果比使用欧氏距离所获得的分类效果鲁棒性更强.
文献关键词:
DNA微阵列数据;高维数据;不平衡分类;谱聚类;相关性系数;闵可夫斯基距离
作者姓名:
陈俊丰;郑中团
作者机构:
上海工程技术大学数理与统计学院,上海 201620
文献出处:
引用格式:
[1]陈俊丰;郑中团-.基于SCFSO-MD算法的DNA微阵列数据分类方法)[J].软件导刊,2022(12):92-97
A类:
SCFSO,特征独立性,SRBCT
B类:
MD,微阵列数据,数据分类,分类方法,类别不平衡,分类准确性,谱聚类,聚类特征,特征选择,基度,过采样,采样算法,特征区,区分度,乘积,中代,代表性特征,选择依据,构造特征,特征子集,使用特征,特征标,差度,斯皮尔曼系数,数度,SMOTE,阶数,闵可夫斯基距离,距离度量,近邻,Leukemia,Colon,Tumor,Ovarian,Cancer,value,优特,仍旧,曼哈顿距离,欧氏距离,分类效果,高维数据,不平衡分类,相关性系数
AB值:
0.39522
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。