首站-论文投稿智能助手
典型文献
引入遗传因子的骨密度机器学习回归模型研究
文献摘要:
目的 构建遗传因素及临床风险因素相结合的骨密度机器学习回归模型,识别影响个体对骨质疏松易感性的最优特征组合.方法 以最大互信息系数与序列浮动前向选择作为两阶段特征选择方法选择最优特征子集,基于随机森林建立骨密度回归模型.结果 在2263例白种人样本数据集进行十折交叉验证实验,结果表明当包含51个SNP位点,6个临床特征时,两阶段特征选择方法结合随机森林模型的均方根误差最低为0.093598 g/cm3,相较仅以临床危险因素作为特征时RMSE降低了5.36%;与选用其他特征选择方法及回归模型的比较实验证实了本文提出模型的良好稳定性.结论 骨质疏松症致病因素分析方法能够发现隐藏的特征间相互作用,识别最优特征组合,从而更好地预测和诊断复杂疾病.
文献关键词:
机器学习;骨质疏松症;骨密度;最大互信息系数;序列特征选择
作者姓名:
陈鹏丽;孔祥勇;林勇
作者机构:
上海理工大学医疗器械与食品学院,上海200093
引用格式:
[1]陈鹏丽;孔祥勇;林勇-.引入遗传因子的骨密度机器学习回归模型研究)[J].中国骨质疏松杂志,2022(10):1459-1464,1471
A类:
序列特征选择
B类:
遗传因子,骨密度,遗传因素,临床风险因素,易感性,优特,特征组合,最大互信息系数,浮动,两阶段特征选择,选择方法,方法选择,特征子集,白种人,人样,样本数据集,十折交叉验证,验证实验,SNP,随机森林模型,cm3,RMSE,比较实验,出模,骨质疏松症,致病因素
AB值:
0.316083
相似文献
金天格胶囊治疗原发性骨质疏松症的有效性及安全性:随机、双盲双模拟、阳性药平行对照、多中心临床试验
王鸥;夏维波;成志峰;夏培金;王亮;沈洁;孔西建;曾玉红;晁爱军;闫莉梅;林华;孙海飚;程群;朱梅;胡侦明;章振林;唐海;尚美霞-100730 北京,中国医学科学院 北京协和医学院 北京协和医院内分泌科,国家卫生健康委员会内分泌重点实验室;150001 哈尔滨,哈尔滨医科大学附属第四医院内分泌科;408099 重庆,重庆市涪陵中心医院内分泌科;100091 北京,中国人民解放军第八医学中心老年医学科;510630 广州,南方医科大学附属第三医院内分泌代谢科;471002 河南 洛阳,洛阳正骨医院(河南省骨科医院)骨质疏松诊疗中心;710086 西安,西安交通大学医学院附属红会医院骨质疏松科;300299 天津,天津市天津医院骨内科;130041 长春,长春市中心医院内分泌科;210008 南京,南京大学医学院附属鼓楼医院骨科;030001 太原,山西医科大学第一医院骨科;200040 上海,复旦大学附属华东医院骨质疏松科;300052 天津,天津医科大学总医院内分泌代谢科;400042 重庆,重庆医科大学附属第一医院骨科;200233 上海,上海交通大学附属第六人民医院骨质疏松和骨病专科;100050 北京,首都医科大学附属北京友谊医院骨科;100034 北京,北京大学第一医院医学统计室
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。