首站-论文投稿智能助手
典型文献
南-北方汉族人、韩国人和日本人遗传划分机器学习模型优化方案
文献摘要:
中国汉族人、韩国人和日本人作为东亚主体人群,其中中国汉族人呈现由北向南的梯度混合,在遗传结构上存在不同程度的差异.为实现对中国南-北方汉族人、韩国人和日本人的高分辨率遗传划分,本研究收集和分析了文献报道和实验室前期数据筛选出的1185个东亚人群祖先信息性SNPs(ancestry informative SNPs,AISNPs),应用softmax与随机森林两种机器学习算法构建族群遗传划分模型,然后利用系统发育树、STRUCTURE和主成分分析方法进一步评估不同模型AISNPs位点组合的族群分类效果,最终筛选出234-AISNP的最优组合,softmax模型准确率为92%,实现了南方汉族人、北方汉族人、韩国人和日本人的高精度区分.本研究测试的两种机器学习算法模型为近距离人群的高分辨率划分提供了重要参考,可作为法医DNA族群推断体系位点开发的重要工具.
文献关键词:
法医遗传学;祖先信息位点;机器学习;东亚人群;南北方汉族
作者姓名:
孔永强;刘金凯;顾佳琪;徐景怡;郑雨诺;魏以梁;伍少远
作者机构:
天津医科大学基础医学院生物化学与分子生物学系,天津市表观遗传学重点实验室,天津 300070;江苏师范大学,江苏省系统发育与比较基因组学重点实验室,徐州 221116
文献出处:
引用格式:
[1]孔永强;刘金凯;顾佳琪;徐景怡;郑雨诺;魏以梁;伍少远-.南-北方汉族人、韩国人和日本人遗传划分机器学习模型优化方案)[J].遗传,2022(11):1028-1043
A类:
亚主体,AISNPs,AISNP,祖先信息位点,南北方汉族
B类:
汉族人,韩国人,日本人,分机,机器学习模型,模型优化,由北向南,遗传结构,期数,数据筛选,东亚人群,信息性,ancestry,informative,softmax,机器学习算法,系统发育树,STRUCTURE,主成分分析方法,分类效果,最优组合,模型准确率,算法模型,近距离,离人,分提,族群推断,法医遗传学
AB值:
0.243873
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。