典型文献
基于数据增强和字词融合特征的实体槽位识别
文献摘要:
针对传统的基于字级表示的实体槽位识别模型无法很好利用词语信息,以及信息技术(IT)运维领域缺少足够数量公开数据集的问题,提出一种基于BERT_Word2vec_BiLSTM_CRF模型的实体槽位识别方法,并通过数据增强对模型的训练数据集进行扩展.该模型将基于转换器的双向编码表征(BERT)模型得到的字向量表示和Word2vec得到的词向量表示进行融合,通过双向长短时记忆(BiLSTM)网络进行上下文编码,通过条件随机场(CRF)进行解码,得到最终的序列标注结果.通过在某企业提供的数据集上进行实验,结果表明:融合词级特征可以在BERT预训练模型的基础上进一步提升识别性能,F1值达到了 92.33%.
文献关键词:
IT运维;实体槽位识别;字词融合;数据增强;基于转换器的双向编码表征(BERT)
中图分类号:
作者姓名:
刘振元;许明阳;王承涛
作者机构:
华中科技大学人工智能与自动化学院,湖北 武汉430074;华中科技大学图像信息处理与智能控制教育部重点实验室,湖北 武汉430074;武汉问道信息技术有限公司,湖北 武汉430050
文献出处:
引用格式:
[1]刘振元;许明阳;王承涛-.基于数据增强和字词融合特征的实体槽位识别)[J].华中科技大学学报(自然科学版),2022(11):101-106
A类:
实体槽位识别
B类:
数据增强,字词融合,融合特征,识别模型,用词,词语,IT,够数,公开数据集,BERT,Word2vec,BiLSTM,CRF,训练数据集,基于转换器的双向编码表征,字向量,向量表示,词向量,双向长短时记忆,上下文编码,条件随机场,解码,序列标注,预训练模型,识别性
AB值:
0.317407
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。