首站-论文投稿智能助手
典型文献
基于参数迁移的领域命名实体识别方法
文献摘要:
[目的/意义]命名实体识别是自然语言处理领域中的基础任务,基于深度学习的方法在通用领域的命名实体中取得了显著成果,但在特定领域识别效果不佳.为了解决工业信息化领域标注数据不足,数据特征差异较大、模型难以扩展的问题,首先提出了一种基于Transformer的有限区间命名实体识别模型.[方法/过程]采用预训练模型对文本进行分布式表示,然后利用基于有限区间的标注方法对输入序列进行标注,解决传统标注法在训练过程中可能导致的序列标注不一致的问题.在此基础上,引入迁移学习策略,采用参数共享的方式,将通用领域的命名实体识别模型迁移到工业信息化领域,并在工业信息化领域数据集上进行微调,最终获得在工业信息化领域上表现良好的模型.[结果/结论]实验结果表明,本文提出的有限区间命名实体识别模型在工业信息化领域数据集上的准确率较基线模型提高了8.7%,基于参数迁移的领域命名实体识别方法在人民日报语料和工业信息化领域数据集上的准确率和综合指标F值相较未使用迁移学习的模型分别提高了3.1%和1.1%,证明了迁移策略的有效性.
文献关键词:
命名实体识别;深度学习;迁移学习;预训练语言模型
作者姓名:
孙新;任翔渝;郑洪超;杨凯歌
作者机构:
北京理工大学计算机学院 北京 100081;富媒体数字出版内容组织与知识服务重点实验室 北京 100038
文献出处:
引用格式:
[1]孙新;任翔渝;郑洪超;杨凯歌-.基于参数迁移的领域命名实体识别方法)[J].情报工程,2022(03):13-27
A类:
B类:
参数迁移,命名实体识别,实体识别方法,自然语言处理,特定领域,工业信息化,数据特征,特征差异,Transformer,限区,识别模型,预训练模型,标注方法,训练过程,序列标注,迁移学习策略,参数共享,模型迁移,微调,基线模型,人民日报,语料,综合指标,迁移策略,预训练语言模型
AB值:
0.237544
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。