典型文献
基于谱聚类的何首乌天然产物聚类分析
文献摘要:
目的 对何首乌中的天然产物进行聚类分析,建立一种较为科学的天然产物聚类方法,为后续化合物挑选、药理筛选提供技术指导.方法 从文献中收集并整理何首乌天然产物,选择二苯乙烯类、蒽醌类等主要类别化合物作为聚类对象,转换为简化分子线性输入规范(SMILES),并使用rdkit提取化合物的扩展连通性指纹和理化性质作为特征,经过方差筛选得到有效的特征.使用谱聚类算法,对何首乌天然产物进行聚类,以Calinski Harabaz(CH)指数作为评估指标,优化聚类参数.采用优化后最佳参数对化合物进行聚类,分析各类别的特点.随后对3种主要类别的化合物进行主成分分析,查看主要类别的空间分布.最后对主要类别化合物分别计算脂水分配系数和拓扑极性表面积,分析性质分布,验证聚类合理性.结果 从文献中挑选13个类别的123个何首乌天然产物.经过特征提取和过滤,共得到207个特征.CH指数表明聚类数量为10,γ为0.004时聚类效果最佳.主成分分析显示3个主要成分组在空间中各自成簇,无重叠情况发生.经过聚类后,脂水分配系数和拓扑极性表面积2个指标倾向更加集中.结论 谱聚类算法不仅能够区分何首乌天然产物中差异较大的化合物,也能较好地对复杂化合物进行聚类,聚类结果具有一定的合理性,能够为传统药理筛选提供新的思路.
文献关键词:
何首乌;天然产物;无监督学习;聚类分析;谱聚类
中图分类号:
作者姓名:
胡笑文;杨建波;魏锋;马双成
作者机构:
中国食品药品检定研究院,北京 102629
文献出处:
引用格式:
[1]胡笑文;杨建波;魏锋;马双成-.基于谱聚类的何首乌天然产物聚类分析)[J].中国药物警戒,2022(04):390-394
A类:
rdkit,Harabaz
B类:
何首乌,天然产物,聚类方法,技术指导,苯乙烯,烯类,蒽醌类,入规,SMILES,扩展连通,连通性,指纹,选得,谱聚类算法,Calinski,CH,最佳参数,查看,脂水分配系数,分析性,聚类数,自成,无监督学习
AB值:
0.2104
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。