典型文献
铝硅合金实体关系抽取数据集的构建方法
文献摘要:
针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标准对收集的数据进行实体标注和关系标注.在标注完成后,通过数据预处理生成铝硅合金实体关系抽取数据集.通过实体关系联合抽取模型进行实验,验证该数据集可以应用于实体关系抽取任务.与公开数据集相比,材料数据集句子的语义和语法更为复杂,长句更多,导致实体关系联合抽取模型在材料数据集上的表现略差.针对上述问题,在实体关系联合抽取模型上加入自注意力机制,使该模型整体的F1值提高了约5.8%.该数据集的构建方法具有普适性,可以通过该构建方法构建材料数据集.
文献关键词:
数据集;构建标准;数据标注;实体关系联合抽取模型;自注意力机制
中图分类号:
作者姓名:
刘英莉;吴瑞刚;么长慧;沈韬
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明 650500;昆明理工大学 云南省计算机技术应用重点实验室,云南 昆明 650500
文献出处:
引用格式:
[1]刘英莉;吴瑞刚;么长慧;沈韬-.铝硅合金实体关系抽取数据集的构建方法)[J].浙江大学学报(工学版),2022(02):245-253
A类:
B类:
铝硅合金,金实,实体关系抽取,构建方法,材料领域,公开数据集,高硅铝合金,喷射沉积,领域专家,构建标准,实体标注,数据预处理,实体关系联合抽取模型,集句,句子,语法,长句,自注意力机制,建材,数据标注
AB值:
0.185551
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。