典型文献
控制混杂因素的基于随机森林方法评价
文献摘要:
目的 在高维组学研究中,混杂因素常常影响着随机森林筛选出与研究结局相关联的变量的能力,因此控制混杂因素具有非常重要的作用.方法 通过模拟试验和实例验证,我们比较了以下四种方法在筛选与研究结局相关联的变量中控制混杂因素的效果:随机森林(random forest,RF);Ranger法;加权Ranger,给予每个混杂因素以100%的权重;残差法,将去除混杂因素的因变量和自变量作为新的因变量和自变量纳入Ranger分析.研究采用危险因素在重要性评分排序中排在第一位的比例作为评价指标.结果 基于大量的模拟试验,我们发现残差法和加权Ranger法有效提高了危险因素在重要性评分排序中排在第一位的比例.GWAS实例证实,在使用这两种方法校正混杂因素之后,危险因素的排序有所提前.结论 校正混杂因素对于筛选与研究结局相关联的变量十分必要,且残差法在混杂因素校正上表现优于加权Ranger法,RF和Ranger几乎无混杂校正作用.
文献关键词:
混杂;随机森林;ranger;加权;重要性评分
中图分类号:
作者姓名:
梁君雅;赵杨;段巍巍;何杰宇;魏永越;陈峰
作者机构:
江苏省中医院,南京市中医药大学附属医院 210000;南京医科大学公共卫生学院生物统计学系;南京医科大学生物医学工程与信息学院生物信息学系;昆明医科大学公共卫生学院
文献出处:
引用格式:
[1]梁君雅;赵杨;段巍巍;何杰宇;魏永越;陈峰-.控制混杂因素的基于随机森林方法评价)[J].中国卫生统计,2022(06):844-849
A类:
高维组学,ranger
B类:
混杂因素,随机森林方法,方法评价,组学研究,素常,相关联,模拟试验,四种方法,中控,random,forest,RF,Ranger,残差法,因变量,重要性评分,分排,中排,排在,第一位,GWAS,例证,方法校正,正上
AB值:
0.263927
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。