动态迁移实体块信息的跨领域中文实体识别模型|吴炳潮;邓成龙;关贝;陈晓霖;昝道广;常志军;肖尊严;曲大成;王永吉|中国科学院大学,北京100049 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

动态迁移实体块信息的跨领域中文实体识别模型

文献摘要：

由于中文文本之间没有分隔符,难以识别中文命名实体的边界.此外,在垂直领域中难以获取充足的标记完整的语料,例如医疗领域和金融领域等垂直领域.为解决上述不足,提出一种动态迁移实体块信息的跨领域中文实体识别模型(TES-NER),将跨领域共享的实体块信息(entity span)通过基于门机制(gate mechanism)的动态融合层,从语料充足的通用领域(源领域)动态迁移到垂直领域(目标领域)上的中文命名实体模型,其中,实体块信息用于表示中文命名实体的范围.TES-NER模型首先通过双向长短期记忆神经网络(BiLSTM)和全连接网络(FCN)构建跨领域共享实体块识别模块,用于识别跨领域共享的实体块信息以确定中文命名实体的边界;然后,通过独立的基于字的双向长短期记忆神经网络和条件随机场(BiLSTM-CRF)构建中文命名实体识别模块,用于识别领域指定的中文命名实体;最后构建动态融合层,将实体块识别模块抽取得到的跨领域共享实体块信息通过门机制动态决定迁移到领域指定的命名实体识别模型上的量.设置通用领域(源领域)数据集为标记语料充足的新闻领域数据集(MSRA),垂直领域(目标领域)数据集为混合领域(OntoNotes 5.0)、金融领域(Resume)和医学领域(CCKS 2017)这3个数据集,其中,混合领域数据集(OntoNotes 5.0)是融合了 6个不同垂直领域的数据集.实验结果表明,提出的模型在OntoNotes 5.0、Resume和CCKS 2017这3个垂直领域数据集上的F1值相比于双向长短期记忆和条件随机场模型(BiLSTM-CRF)分别高出2.18％、1.68％和0.99％.

文献关键词：

命名实体识别;迁移学习;跨领域;动态融合;双向长短期记忆神经网络

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18）

作者姓名：

吴炳潮;邓成龙;关贝;陈晓霖;昝道广;常志军;肖尊严;曲大成;王永吉

作者机构：

中国科学院软件研究所协同创新中心,北京100190;中国科学院大学,北京100049;中国科学院文献情报中心,北京100190;北京理工大学计算机学院,北京100081;计算机科学国家重点实验室(中国科学院软件研究所),北京100190

文献出处：

软件学报

引用格式：

[1]吴炳潮;邓成龙;关贝;陈晓霖;昝道广;常志军;肖尊严;曲大成;王永吉-.动态迁移实体块信息的跨领域中文实体识别模型)[J].软件学报,2022(10):3776-3792

A类：

B类：

动态迁移,体块,跨领域,识别模型,中文文本,分隔符,垂直领域,语料,医疗领域,金融领域,TES,NER,entity,span,门机制,gate,mechanism,动态融合,源领域,实体模型,双向长短期记忆神经网络,BiLSTM,全连接网络,FCN,识别模块,条件随机场,CRF,中文命名实体识别,过门,集为,标记语,MSRA,合领,OntoNotes,Resume,医学领域,CCKS,迁移学习

AB值：

0.212799

相似文献

中文命名实体识别综述

赵山;罗睿;蔡志平-国防科技大学计算机学院,长沙 410073

命名实体识别方法研究综述

李冬梅;罗斯斯;张小平;许福-北京林业大学信息学院,北京 100083;国家林业和草原局林业智能信息处理工程技术研究中心,北京 100083;中国中医科学院中医药信息研究所,北京 100700

基于BERT的初等数学文本命名实体识别方法

张毅;王爽胜;何彬;叶培明;李克强-重庆邮电大学通信与信息工程学院,重庆400065

融合多语义特征的命名实体识别方法

左亚尧;陈皓宇;陈致然;洪嘉伟;陈坤-广东工业大学计算机学院,广州510006

基于知识库实体增强BERT模型的中文命名实体识别