典型文献
基于"聚类-过采样"方法的肿瘤免疫亚型分类研究
文献摘要:
分类学习方法有一个基本假设,即不同类别的样本数量相当.样本数量分布不均衡,会影响分类的准确率.针对样本分布不平衡的肿瘤亚型分类问题,提出聚类-过采样(clustering minority over-sampling technique,CMOT),避免了算法"对少数类不友好"的情况.具体来说,首先在少数类的内部进行聚类,目的在于寻找少数类数据的分布结构.其次,使用改进的过采样方法,对少数类数据进行数据增强,最终实现不同类别的样本数量均衡.对比四种过采样方法,使用CMOT方法,肿瘤免疫亚型的分类准确率达到98.79%,明显高于其他方法.CMOT方法能够捕获少数类样本的真实特征,产生的伪样本足以平衡数据集,进而提升分类模型的精度.
文献关键词:
肿瘤免疫亚型;聚类-过采样法;聚类;样本不平衡;分类
中图分类号:
作者姓名:
田夫蓉;白新宇
作者机构:
贵州师范大学大数据与计算机科学学院,贵阳 550000
文献出处:
引用格式:
[1]田夫蓉;白新宇-.基于"聚类-过采样"方法的肿瘤免疫亚型分类研究)[J].现代计算机,2022(01):32-37
A类:
肿瘤免疫亚型,CMOT
B类:
过采样,分类研究,分类学,基本假设,样本数量,数量分布,样本分布,分布不平衡,肿瘤亚型,分类问题,clustering,minority,over,sampling,technique,少数类,具体来说,分布结构,采样方法,数据增强,种过,分类准确率,其他方法,平衡数据集,分类模型,采样法,样本不平衡
AB值:
0.318853
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。