典型文献
融合遗传算法与XGBoost的玉米百粒重相关基因挖掘
文献摘要:
基于RNA-Seq的转录组测序数据特征维度较高,使用传统生信方法寻找表型相关基因需要大量计算资源,且差异分析所得候选基因范围较大,进一步筛选依赖已有的先验知识.针对这一问题,本文提出了融合遗传算法和XGBoost的转录组分析方法—GA-XGBoost,通过融入机器学习算法缩小了后续分析的候选基因范围.在一组高质量玉米数据集上对基因–百粒重性状的关联进行了对比实验和后续分析,结果显示,相比于分别使用全体基因和差异表达基因直接训练XGBoost模型,所提方法得到的候选基因训练的XGBoost模型在玉米百粒重的预测结果上具有最小的MSE;相比于差异表达分析结果的1542个差异表达基因,GA-XGBoost方法最终将候选基因范围减小至48个,范围缩小了31倍,表明所提方法能够有效提升对转录组数据的分析能力和效率.
文献关键词:
遗传算法;极限梯度提升算法;机器学习;玉米;转录组分析;百粒重;基因本体;京都基因与基因组百科全书
中图分类号:
作者姓名:
杨帅;郭茂祖;赵玲玲;李阳
作者机构:
北京建筑大学电气与信息工程学院,北京 100044;建筑大数据智能处理方法研究北京市重点实验室,北京 100044;哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨 150001
文献出处:
引用格式:
[1]杨帅;郭茂祖;赵玲玲;李阳-.融合遗传算法与XGBoost的玉米百粒重相关基因挖掘)[J].智能系统学报,2022(01):170-180
A类:
B类:
XGBoost,百粒重,粒重相关基因,基因挖掘,Seq,转录组测序,序数,数据特征,生信,计算资源,候选基因,先验知识,转录组分析,GA,机器学习算法,差异表达基因,MSE,差异表达分析,终将,转录组数据,分析能力,极限梯度提升算法,基因本体,京都基因与基因组百科全书
AB值:
0.262417
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。