首站-论文投稿智能助手
典型文献
SC-BPSO:肝癌分类中一种融合过滤器的二进制粒子群算法特征的选择方法
文献摘要:
癌症的早期诊断能够显著提高癌症患者的存活率,在肝细胞癌患者中这种情况更加明显.机器学习是癌症分类中的有效工具.如何在复杂和高维的癌症数据集中,选择出低维度、高分类精度的特征子集是癌症分类的难题.本文提出了 一种二阶段的特征选择方法SC-BPSO:通过组合Spearman相关系数和卡方独立检验作为过滤器的评价函数,设计了一种新型的过滤器方法——SC过滤器,再组合SC过滤器方法和基于二进制粒子群算法(BPSO)的包裹器方法,从而实现两阶段的特征选择.并应用在高维数据的癌症分类问题中,区分正常样本和肝细胞癌样本.首先,对来自美国国家生物信息中心(NCBI)和欧洲生物信息研究所(EBI)的130个肝组织microRNA序列数据(64肝细胞癌,66正常肝组织)进行预处理,使用MiRME算法从原始序列文件中提取microRNA的表达量、编辑水平和编辑后表达量3类特征.然后,调整SC-BPSO算法在肝细胞癌分类场景中的参数,选择出关键特征子集.最后,建立分类模型,预测结果,并与信息增益过滤器、信息增益率过滤器、BPSO包裹器特征选择算法选出的特征子集,使用相同参数的随机森林、支持向量机、决策树、KNN四种分类器分类,对比分类结果.使用SC-BPSO算法选择出的特征子集,分类准确率高达98.4%.研究结果表明,与另外3个特征选择算法相比,SC-BPSO算法能有效地找到尺寸较小和精度更高的特征子集.这对于少量样本高维数据的癌症分类问题可能具有重要意义.
文献关键词:
癌症分类;特征选择;机器学习;肝细胞癌;微RNA;二进制粒子群算法
作者姓名:
周楠;郑云
作者机构:
昆明理工大学信息工程及自动化学院,基础化学实验楼410室,昆明650500;昆明理工大学灵长类转化医学研究院,省部共建非人灵长类生物医学国家重点实验室,昆明650500
引用格式:
[1]周楠;郑云-.SC-BPSO:肝癌分类中一种融合过滤器的二进制粒子群算法特征的选择方法)[J].中国生物化学与分子生物学报,2022(08):1106-1116
A类:
MiRME
B类:
SC,BPSO,肝癌,过滤器,二进制粒子群算法,算法特征,选择方法,癌症患者,肝细胞癌,癌症分类,低维,分类精度,特征子集,二阶段,独立检验,评价函数,两阶段,高维数据,分类问题,信息中心,NCBI,信息研究,EBI,肝组织,microRNA,序列数据,关键特征,分类模型,信息增益率,特征选择算法,同参数,决策树,KNN,分类器,算法选择,分类准确率,少量样本
AB值:
0.227071
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。