典型文献
引入遗传因子的骨密度机器学习回归模型研究
文献摘要:
目的 构建遗传因素及临床风险因素相结合的骨密度机器学习回归模型,识别影响个体对骨质疏松易感性的最优特征组合.方法 以最大互信息系数与序列浮动前向选择作为两阶段特征选择方法选择最优特征子集,基于随机森林建立骨密度回归模型.结果 在2263例白种人样本数据集进行十折交叉验证实验,结果表明当包含51个SNP位点,6个临床特征时,两阶段特征选择方法结合随机森林模型的均方根误差最低为0.093598 g/cm3,相较仅以临床危险因素作为特征时RMSE降低了5.36%;与选用其他特征选择方法及回归模型的比较实验证实了本文提出模型的良好稳定性.结论 骨质疏松症致病因素分析方法能够发现隐藏的特征间相互作用,识别最优特征组合,从而更好地预测和诊断复杂疾病.
文献关键词:
机器学习;骨质疏松症;骨密度;最大互信息系数;序列特征选择
中图分类号:
作者姓名:
陈鹏丽;孔祥勇;林勇
作者机构:
上海理工大学医疗器械与食品学院,上海200093
文献出处:
引用格式:
[1]陈鹏丽;孔祥勇;林勇-.引入遗传因子的骨密度机器学习回归模型研究)[J].中国骨质疏松杂志,2022(10):1459-1464,1471
A类:
序列特征选择
B类:
遗传因子,骨密度,遗传因素,临床风险因素,易感性,优特,特征组合,最大互信息系数,浮动,两阶段特征选择,选择方法,方法选择,特征子集,白种人,人样,样本数据集,十折交叉验证,验证实验,SNP,随机森林模型,cm3,RMSE,比较实验,出模,骨质疏松症,致病因素
AB值:
0.316083
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。