首站-论文投稿智能助手
典型文献
环境微生物研究中机器学习算法及应用
文献摘要:
微生物在环境中无处不在,它们不仅是生物地球化学循环和环境演化的关键参与者,也在环境监测、生态治理和保护中发挥着重要作用.随着高通量技术的发展,大量微生物数据产生,运用机器学习对环境微生物大数据进行建模和分析,在微生物标志物识别、污染物预测和环境质量预测等领域的科学研究和社会应用方面均具有重要意义.机器学习可分为监督学习和无监督学习2大类.在微生物组学研究当中,无监督学习通过聚类、降维等方法高效地学习输入数据的特征,进而对微生物数据进行整合和归类.监督学习运用有特征和标记的微生物数据集训练模型,在面对只有特征没有标记的数据时可以判断出标记,从而实现对新数据的分类、识别和预测.然而,复杂的机器学习算法通常以牺牲可解释性为代价来重点关注模型预测的准确性.机器学习模型通常可以看作预测特定结果的"黑匣子",即对模型如何得出预测所知甚少.为了将机器学习更多地运用于微生物组学研究、提高我们提取有价值的微生物信息的能力,深入了解机器学习算法、提高模型的可解释性尤为重要.本文主要介绍在环境微生物领域常用的机器学习算法和基于微生物组数据的机器学习模型的构建步骤,包括特征选择、算法选择、模型构建和评估等,并对各种机器学习模型在环境微生物领域的应用进行综述,深入探究微生物组与周围环境之间的关联,探讨提高模型可解释性的方法,并为未来环境监测、环境健康预测提供科学参考.
文献关键词:
机器学习;微生物组;环境微生物;16SrRNA基因;宏基因组
作者姓名:
陈鹤;陶晔;毛振镀;邢鹏
作者机构:
中国科学院南京地理与湖泊研究所,湖泊与环境国家重点实验室,江苏南京210008;中国科学院大学,北京100049
文献出处:
引用格式:
[1]陈鹤;陶晔;毛振镀;邢鹏-.环境微生物研究中机器学习算法及应用)[J].微生物学报,2022(12):4646-4662
A类:
B类:
环境微生物,机器学习算法,无处不在,生物地球化学循环,环境演化,环境监测,生态治理,治理和保护,高通量技术,生物数据,生物大数据,生物标志物,环境质量预测,无监督学习,微生物组学,组学研究,学习通,地学,输入数据,集训,训练模型,新数据,常以,机器学习模型,黑匣子,所知,甚少,生物领域,特征选择,算法选择,周围环境,模型可解释性,环境健康,健康预测,16SrRNA,宏基因组
AB值:
0.280164
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。