典型文献
宏基因组重叠群分箱方法研究综述
文献摘要:
宏基因组学技术可以直接从环境中提取微生物的全部遗传物质,而不需要像传统方法一样在培养基上纯培养.这种技术的出现为科学家对微生物群落的结构和功能的认识提供了重要的方法,同时对疾病的诊治、环境的治理以及生命的认识具有重大的意义.从环境中提取出微生物全部遗传物质,对其进行测序从而得到它们的reads片段,通过reads组装工具可以进一步组装成重叠群片段.对重叠群片段进行分箱,可以从宏基因组样本中重建出更多完整的基因.分箱效果的好坏直接影响到后续的生物分析,因此如何将这些含有不同微生物基因混合的重叠群序列进行有效的分箱成为了宏基因组学研究的热点和难点.机器学习方法被广泛应用于宏基因组重叠群分箱,通常分为有监督重叠群分类方法和无监督重叠群聚类方法.该综述针对宏基因组重叠群分箱方法进行了较为全面的阐述,深入剖析了重叠群分类方法与聚类方法,发现其存在分类准确率较低、分箱时间较长、难以从复杂数据集中重建更多微生物基因等问题,并对未来重叠群分箱方法的研究和发展进行了展望.作者建议可以使用半监督学习、集成学习以及深度学习方法,并采用更有效的数据特征表示等途径来提高分箱效果.
文献关键词:
宏基因组学;机器学习;重叠群;分箱;聚类;分类
中图分类号:
作者姓名:
姜忠俊;李小波
作者机构:
宁波大学信息科学与工程学院,浙江宁波315211;浙江师范大学数学与计算机科学学院,浙江金华321004
文献出处:
引用格式:
[1]姜忠俊;李小波-.宏基因组重叠群分箱方法研究综述)[J].微生物学报,2022(08):2954-2968
A类:
B类:
重叠群,分箱,宏基因组学技术,遗传物质,纯培养,微生物群落,群落的结构,结构和功能,reads,装工,装成,好坏,生物分析,生物基,组学研究,机器学习方法,有监督,分类方法,无监督,群聚,聚类方法,分类准确率,复杂数据,半监督学习,集成学习,深度学习方法,数据特征,特征表示
AB值:
0.207915
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。