首站-论文投稿智能助手
典型文献
动态迁移实体块信息的跨领域中文实体识别模型
文献摘要:
由于中文文本之间没有分隔符,难以识别中文命名实体的边界.此外,在垂直领域中难以获取充足的标记完整的语料,例如医疗领域和金融领域等垂直领域.为解决上述不足,提出一种动态迁移实体块信息的跨领域中文实体识别模型(TES-NER),将跨领域共享的实体块信息(entity span)通过基于门机制(gate mechanism)的动态融合层,从语料充足的通用领域(源领域)动态迁移到垂直领域(目标领域)上的中文命名实体模型,其中,实体块信息用于表示中文命名实体的范围.TES-NER模型首先通过双向长短期记忆神经网络(BiLSTM)和全连接网络(FCN)构建跨领域共享实体块识别模块,用于识别跨领域共享的实体块信息以确定中文命名实体的边界;然后,通过独立的基于字的双向长短期记忆神经网络和条件随机场(BiLSTM-CRF)构建中文命名实体识别模块,用于识别领域指定的中文命名实体;最后构建动态融合层,将实体块识别模块抽取得到的跨领域共享实体块信息通过门机制动态决定迁移到领域指定的命名实体识别模型上的量.设置通用领域(源领域)数据集为标记语料充足的新闻领域数据集(MSRA),垂直领域(目标领域)数据集为混合领域(OntoNotes 5.0)、金融领域(Resume)和医学领域(CCKS 2017)这3个数据集,其中,混合领域数据集(OntoNotes 5.0)是融合了 6个不同垂直领域的数据集.实验结果表明,提出的模型在OntoNotes 5.0、Resume和CCKS 2017这3个垂直领域数据集上的F1值相比于双向长短期记忆和条件随机场模型(BiLSTM-CRF)分别高出2.18%、1.68%和0.99%.
文献关键词:
命名实体识别;迁移学习;跨领域;动态融合;双向长短期记忆神经网络
作者姓名:
吴炳潮;邓成龙;关贝;陈晓霖;昝道广;常志军;肖尊严;曲大成;王永吉
作者机构:
中国科学院软件研究所协同创新中心,北京100190;中国科学院大学,北京100049;中国科学院文献情报中心,北京100190;北京理工大学计算机学院,北京100081;计算机科学国家重点实验室(中国科学院软件研究所),北京100190
文献出处:
引用格式:
[1]吴炳潮;邓成龙;关贝;陈晓霖;昝道广;常志军;肖尊严;曲大成;王永吉-.动态迁移实体块信息的跨领域中文实体识别模型)[J].软件学报,2022(10):3776-3792
A类:
B类:
动态迁移,体块,跨领域,识别模型,中文文本,分隔符,垂直领域,语料,医疗领域,金融领域,TES,NER,entity,span,门机制,gate,mechanism,动态融合,源领域,实体模型,双向长短期记忆神经网络,BiLSTM,全连接网络,FCN,识别模块,条件随机场,CRF,中文命名实体识别,过门,集为,标记语,MSRA,合领,OntoNotes,Resume,医学领域,CCKS,迁移学习
AB值:
0.212799
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。