首站-论文投稿智能助手
典型文献
融合材料领域知识的数据准确性检测方法
文献摘要:
材料数据由于小样本、高维度、噪音大等特性,用于机器学习建模时常常会产生与领域专家认知不一致的结果.面向机器学习全流程,开发材料领域知识嵌入的机器学习模型是解决这一问题的有效途径.材料数据的准确性直接影响了数据驱动的材料性能预测的可靠性.本研究针对机器学习应用过程中的数据预处理阶段,提出了融合材料领域知识的数据准确性检测方法.该方法首先结合材料专家认知构建了材料领域知识库.然后,将其与数据驱动的数据准确性检测方法结合,从数据和领域知识两个角度对材料数据集进行基于描述符取值规则的单维度数据正确性检测、基于描述符相关性规则的多维度数据相关性检测以及基于多维相似样本识别策略的全维度数据可靠性检测.对于每一阶段识别出的异常数据,结合材料领域知识进行修正,并将领域知识融入到数据准确性检测方法的全过程以确保数据集从初始阶段就具有较高准确性.最后该方法在NASICON型固态电解质激活能预测数据集上的实验结果表明:本研究提出的方法可以有效识别异常数据并进行合理修正.与原始数据集相比,基于修正数据集的6种机器学习模型的预测精度都有不同程度的提升.其中,在最优模型上R2提升了33%.
文献关键词:
机器学习;材料科学;数据质量;领域知识
作者姓名:
施思齐;孙拾雨;马舒畅;邹欣欣;钱权;刘悦
作者机构:
上海大学 材料基因组工程研究院, 上海 200444;上海大学 材料科学与工程学院, 上海 200444;之江实验室, 杭州 311100;上海大学 计算机工程与科学学院, 上海 200444;上海大学 上海市智能计算系统工程技术研究中心, 上海 200444
文献出处:
引用格式:
[1]施思齐;孙拾雨;马舒畅;邹欣欣;钱权;刘悦-.融合材料领域知识的数据准确性检测方法)[J].无机材料学报,2022(12):1311-1320,中插1-中插5
A类:
符取
B类:
材料领域,领域知识,数据准确性,小样本,高维度,噪音,机器学习建模,领域专家,知识嵌入,机器学习模型,材料性能预测,学习应用,数据预处理,结合材料,认知构建,知识库,描述符,多维度数据,数据相关性,识别策略,全维度,数据可靠性,可靠性检测,阶段识别,异常数据,将领,初始阶段,NASICON,固态电解质,激活能,预测数据,原始数据,正数,最优模型,材料科学,数据质量
AB值:
0.399856
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。