首站-论文投稿智能助手
典型文献
基于流形嵌入的宏基因组叠连群分箱方法研究
文献摘要:
宏基因组组装往往只能得到较长片段的叠连群,无法恢复完整的基因组.现有的一些分箱方法并未充分挖掘叠连群序列组成和样本覆盖度内部结构信息.开发了基于流形嵌入的宏基因组学叠连群分箱方法,可以挖掘出高维数据中内部的非线性结构特征,从而降低数据的维度,提高计算性能.使用流形嵌入的结果估计出初始分箱数,比使用基于单拷贝基因的分箱数初始化方法更为高效.基于序列组成和样本覆盖度信息,流形嵌入更好地表现出了高维数据嵌入空间的内部结构,为分箱器提供了更有效的特征信息.实验对比了其他方法,结果表明所提方法在SpeciesMock数据集上达到了最高的准确率(ACC)、归一化互信息(NMI)和归一化兰德指数(ARI).
文献关键词:
宏基因组;分装;流形嵌入
作者姓名:
何翀;王美丽;景旭
作者机构:
西北农林科技大学信息工程学院 陕西 咸阳712100;西北农林科技大学农业农村部农业物联网重点实验室 陕西 咸阳712100;西北农林科技大学陕西省农业信息感知与智能服务重点实验室 陕西 咸阳712100
引用格式:
[1]何翀;王美丽;景旭-.基于流形嵌入的宏基因组叠连群分箱方法研究)[J].计算机应用与软件,2022(03):82-88
A类:
SpeciesMock
B类:
流形嵌入,分箱,基因组组装,长片,覆盖度,结构信息,宏基因组学,挖掘出,高维数据,线性结构,拷贝,初始化方法,特征信息,实验对比,其他方法,上达,ACC,归一化互信息,NMI,兰德,ARI,分装
AB值:
0.296662
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。