首站-论文投稿智能助手
典型文献
基于自动弱标注数据的跨领域命名实体识别
文献摘要:
近年来,在大规模标注语料上训练的神经网络模型大大提升了命名实体识别任务的性能.但是,新领域人工标注数据获取代价高昂,如何快速、低成本地进行领域迁移就显得非常重要.在目标领域仅给定无标注数据的情况下,该文尝试自动构建目标领域的弱标注语料并对其建模.首先,采用两种不同的方法对无标注数据进行自动标注;然后,采用留"同"去"异"的方式,尽量减少错误标注,自动生成局部标注的语料;最终,该文提出一种新的基于局部标注学习的实体识别模型,该模型可以在弱标注数据上进行训练.新闻领域到社交领域和金融领域的迁移实验结果证明,该文方法能有效提升命名实体识别模型的领域自适应性能,并且迁移代价较低.在加入预训练语言模型BERT的条件下,该方法也表现出较好的性能.
文献关键词:
命名实体识别;领域适应;局部标注
作者姓名:
方晔玮;王铭涛;陈文亮;张熠天;张民
作者机构:
苏州大学 计算机科学与技术学院,江苏 苏州 215006;国家工业信息安全发展研究中心,北京 100043
文献出处:
引用格式:
[1]方晔玮;王铭涛;陈文亮;张熠天;张民-.基于自动弱标注数据的跨领域命名实体识别)[J].中文信息学报,2022(03):73-81,90
A类:
局部标注,领域自适应性
B类:
跨领域,命名实体识别,语料,新领域,数据获取,价高,高昂,移就,自动构建,构建目标,自动标注,尽量减少,错误标注,自动生成,识别模型,交领,金融领域,迁移实验,迁移代价,预训练语言模型,BERT,领域适应
AB值:
0.259735
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。